研究队伍
当前位置:首页 > 研究队伍 > 黄永祯
黄永祯    博士,副研究员
黄永祯,1983年11月生,博士,副研究员。2006年毕业于华中科技大学自动化学院,自动化专业,获学士学位。2011年毕业于中国科学院自动化研究所,模式识别与智能系统专业,获博士学位。2011年作为助理研究员任职于中国科学院自动化研究所,2013年起任副研究员。获得奖项及荣誉称号包括:中国人工智能学会优秀博士论文奖(全国共5篇)、中国专利优秀奖、北京市发明专利奖、PASCAL VOC国际目标检测竞赛冠军和目标分类竞赛亚军、国际低功耗图像识别竞赛(LPIRC)亚军和最低功耗奖、中国云移动互联网人形图像分割大赛冠军和特别奖。承担的主要项目包括:自然科学基金委青年项目“基于特征结构关系的目标分类研究”负责人、自然科学基金委重点项目“基于非欧氏空间的视觉计算理论与方法”子课题负责人、清华信息科学与技术国家实验室学科交叉基金重点项目“基于局部特征关系的目标识别研究”负责人、三星全球科研基金“移动平台下的高精度人形分割研究”负责人、科技部973项目“认知的基本单元”学术骨干,以及腾讯、华为、奇虎360等多家公司委托的深度学习项目。
主要研究方向及内容

1、基于反馈神经网络的视觉目标分类、定位、分割一体化研究
人眼视觉系统在观察图像的时候,会根据目标类别等信息对图像中各个目标做出不同的反应,并主动地完成目标定位与分割,这种现象类似于自顶向下的注意机制。我们试图探索并建模视觉神经实时观察外部环境时所表现的多任务反馈过程,借鉴视觉系统中的反馈机制,突破传统模式识别算法只在训练过程中进行反馈的局限,有望通过多任务反馈神经网络从根源上解决分类、定位、分割这三个模式识别领域最基础的任务。

2、 基于神经网络信号传导启发的新型深度神经网络模型探索
计算神经学研究表明:对神经元信号传导化学反应进行约10次近似数学建模后,可以得到现代神经网络中最基础的优化算法Back Propagation(BP)。深度学习鼻祖Hinton在2012年提出来的著名的dropout技术就来源于对上述近似数学建模的还原,证明了计算神经学的魅力。我们希望通过对神经元信息传导进行更精确的建模,以及开展对神经元信号传导原始建模的逼近来研究新型深度神经网络模型,并将其应用于视觉计算的多项任务。

代表性论文

Yongzhen Huang and Tieniu Tan, Feature coding for Image Representation and Recognition, Springer, Invited Book, ISBN: 978-3-662-44999-8, 2014.

Yongzhen Huang, Zifeng Wu, Liang Wang, and Tieniu Tan, Feature Coding in Image Classification: AComprehensive Study, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2014, 36(3), 493-506.

Yongzhen Huang, Kaiqi Huang, Dacheng Tao, Xuelong Li and Tieniu Tan, Enhanced Biologically Inspired Model for Object Recognition, IEEE Transactions on Systems, Man and Cybernetics, Part B (TSMC-B), 2011, 41(6), 1668-1680.

Yongzhen Huang, Zifeng Wu, Liang Wang, and Chunfeng Song, Multiple Spatial Pooling for Visual Object Recognition,Neurocomputing (NEUCOM), 2014, 129, 225-231.

Zifeng Wu, Yongzhen Huang, and Liang Wang, Learning Representative Deep Features for Image Set Analysis, IEEE Transactions on Multimedia (TMM), accepted, 2015.

Jianwei Ding, Yongzhen Huang, Wei Liu, and Kaiqi Huang, Severely Blurred Object Tracking by Learning Deep Image Representations, IEEE Transactions on Circuits and System for Video Technology (TCSVT), accepted, 2015.

Feng Liu, Yongzhen Huang, Liang Wang, Wankou Yang, Changyin Sun, Spatial Modeling Via Feature Co-pooling and SG Grafting, Neurocomputing (NEUCOM), 2014, 139, 415-422.

Jingyu Liu, Yongzhen Huang, Liang Wang, Shu Wu, Hierarchical Feature Coding for Image Classification, Neurocomputing (NEUCOM), 2014, 144, 509-515.

Yongzhen Huang, Kaiqi Huang, Yinan Yu, Tieniu Tan, Salient Coding for Image Classification, IEEE Conference on Computer Vision and Pattern Recognition, (CVPR), 2011.

Yongzhen Huang, Kaiqi Huang, Chong Wang, Tieniu Tan, Exploring Visual Words’ relation for Image Classification, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2011.

Yongzhen Huang, Kaiqi Huang, Liangsheng Wang, Dacheng Tao, Tieniu Tan and Xuelong Li, Enhanced Biologically Inspired Model, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2008.

Fang Zhao, Yongzhen Huang, Liang Wang, and Tieniu Tan, Deep Semantic Ranking Based Hashing for Multi-Label Image Retrieval, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2015.

Chunshui Cao, Yongzhen Huang et al., Look and Think Twice: Capturing Top-Down Visual Attention with Feedback Convolutional Neural Networks, IEEE Conference on Computer Vision (ICCV), 2015.

Fang Zhao, Yongzhen Huang, Liang Wang, and Tieniu Tan, Relevance Topic Model for Unstructured SocialGroup Activity Recognition, Conference on NeuralInformation Processing Systems (NIPS), 2013.

Wei Tang, Yongzhen Huang, Liang Wang, 1000 fps Highly Accurate Eye Detection with Stacked DenoisingAutoencoder, Chinese Conference on Computer Vision (CCCV, Best Student Paper), 2015.

实验室网址:http://www.nlpr.ia.ac.cn/english/irds/People/yzhuang.html
E-mail: yzhuang@nlpr.ia.ac.cn
电话:010-82544486