研究进展
当前位置:首页 > 研究进展
一种基于神经生理机制的层次化视差计算模型
发布日期:2015-11-18    浏览次数:346

人类的左右眼之间存在水平间距,使得外界物体在左右眼视网膜上的成像存在位置差异,称之为视差,它是人类最重要的双眼深度信息。左右眼视网膜的信息最初在初级视皮层进行融合,在此之前左右眼信息是相互分离的。初级视觉系统的复杂细胞被认为是最早的视差编码单元,然而复杂细胞不仅对正确匹配有响应,同时还对不能够引起人类深度感知的错误匹配有响应。这说明在高级视觉系统必然存在消除错误匹配已获得正确深度感知的机制。由于目前对这一层次化的处理机制还不是很清楚,卓越中心曾毅研究员课题组针对这一问题,研究层次化的视差计算模型。课题组提出的层次化的视差计算模型有三个方面的特性:

(1) 从低层到高层,视差的计算越来越准确,图1显示了4个数据的测试结果,从低层到高层错误点(红色点)的数量越来越少;

  
图1. 层次化视差计算模型在四个数据集上的视差计算结果,从左到右为从低层到高层的结果。

(2) 从低层到高层,正确匹配处的神经元的响应越来越强,同时抑制了错误匹配处神经元的响应,如图2所示;

图2. 左右两图的真实视差分别为6和7,蓝线是第一层神经元的响应曲线,红线线是输出层神经元的响应曲线。

(3) 具有很好的泛化能力,该网络训练所用的数据是从任一立体图对中选择出10%的像素点对,测试数据是由剩余的90%的像素点对和其它立体图对组成的。由于训练数据是随机选取的,另外不同的立体图对的视差范围是不同的,所以测试数据中的很多视差在训练数据中是不存在正样本的。即便如此,本文提出的模型依然能够表现出较好的性能,体现出该模型较好的泛化能力。

此项研究由孔庆群、曾毅、董秋雷合作完成。文章题为“Biologically Inspired Deep Stereo Model”,发表于Proceedings of the 2015 IEEE International Conference on Image Processing (ICIP 2015), 2015.