图像计算与感知智能研究所-北京理工大学计算机学院

图像计算与感知智能研究所

图像计算与感知智能研究所面向国家重大需求，瞄准机器智能国际学术前沿，依托计算机北京市重点学科和智能信息技术北京市重点实验室，主要研究计算视觉与认知、图像/视频学习与推理、网络媒体数据标注与检索、海量数据分析与可视化、医学影像分析与处理、立体视觉与深度感知、目标识别与跟踪、人脸检测与识别、3D场景重建与交互等理论与方法，研究智能机器人、智能人机交互、智能监控等系统和技术。

研究所现有教师11位，其中教授6位，博士生导师8位，硕士生导师11位，教育部新世纪人才计划入选者1人，启明计划入选者1人，人工智能学会优秀博士学位论文奖1人、提名奖1人。80%以上的教师具有海外学习和研究经历。

研究所近年来承担国家自然科学基金项目30余项，人均2项以上；承担国家973子课题、863课题、国家重点研发项目10余项；获教育部高校发明奖、国防科技奖和兵器科技奖等省部级科技奖励5项；申请和授权国家发明专利授权近100项。在国际重要刊物和会议上发表学术论文600余篇，其中在TPAMI、IJCV、TIP、TNNLS等国际权威刊物和ICCV、CVPR、AAAI、IJCAI等国际顶级会议上发表论文近100篇，ESI高被引论文5篇。主要研究成果包括：

1.视频事件理解与人体动作识别。研究网络媒体视频和监控视频中的事件理解方法和算法，包括深度学习视频事件的表示、图像视频迁移学习、单人动作识别和定位、多人交互动作行为分析、非正常事件的检测与定位、视频事件的语义表示和分析等。提出了增量式判别分析动作识别方法、多人交互行为模型表示与学习方法、多种交互信息自底向上的行为学习和推理方法，建立了BIT动作数据集。研究成果发表在ICCV、ECCV等顶会和TPAMI、IJCV等顶刊上。

BIT动作识别数据集

2. 高性能立体视觉计算系统。研究高性能立体视觉计算架构，包括GPU深度学习计算架构和FPGA+DSP嵌入式计算架构；研究立体视觉匹配，立体视觉系统自动标定，包括大场景立体视觉系统标定、自动标定光学系统设计、高精度自动标定算法等。研发的FPGA立体视觉机，能以视频速度（30帧/秒）计算场景稠密深度图，系统体积小、功耗低，获得教育部高校技术发明二等奖；研发的高速高性能立体视觉测量系统，能实现上万帧/秒立体图像的获取，获得国防科学技术三等奖。

高性能立体视觉机超高速立体视觉系统

3.视觉目标跟踪。研究视频序列中感兴趣目标连续运动状态估计的计算模型和算法，特别是机器学习、信号处理和优化理论在视觉跟踪中的应用，包括压缩感知、相关滤波以及深度学习。提出了张量池化与广义池化的概念，基于部件概率空间的目标跟踪，基于非线性学习线性近似理论的目标跟踪，流形正则的相关滤波目标跟踪算法，以及分阶段半监督卷积神经网络目标跟踪算法等。研究成果发表在ICCV、IEEETIP、TNNLS和TCYB等顶级期刊和会议上。

视觉目标跟踪结果图例

4.立体视觉显著性计算与智能缩放方法。研究立体图像在显示过程中，将立体图像对的深度信息引入到视觉显著性计算中，计算视觉显著性区域以及对这些重要关注区域进行有效分割。通过立体相机Kinect设备获得场景的真实深度信息，将深度信息引入到立体图像的智能缩放中，可以获得复杂场景下较好的智能缩放效果。利用立体图像的深度信息计算图像的显著图，更多地保留近处的物体，提高智能缩放的图像视觉效果。相关研究成果发表在IEEETCYB， IEEECSVT，IEEETIP和IEEETPAMI等权威国际期刊上。

立体视觉显著性检测与分割算法

5.人脸表示与识别。研究人脸表示与识别的深度学习方法，包括人脸检测，人脸识别，人脸比对，活体检测以及人脸检索。提出了采用深度异构哈希网络的跨模态人脸检索方法，采用深度光照无关网络进行人脸识别的方法，以及基于生成对抗网络的人脸活体检测方法,研究成果发表在计算机视觉及人工智能顶级会议CVPR和AAAI以及国际权威期刊T-MM和PR上。

人脸表示与识别

6.场景理解与虚拟现实中的应用。从计算机视觉、认知科学以及虚拟现实应用的角度研究场景中物体的功能性、物体之间的关系以及场景变化的因果关系模型。提出了基于关系语义图的场景表达方法并结合因果关系模型联合推理场景的变化以及人的行为；提出了在虚拟场景中基于物理仿真的研究物体功能性的方法；以地震避险为背景，在虚拟现实中研究场景的安全性以及人的避险策略。研究成果发表在人工智能、认知科学以及虚拟现实顶级会议IJCAI，CogSci和IEEE VR上。

结合因果关系模型的场景变化及人的行为的联合推理

7.多模态表示与推理。研究了视觉关系推理、多模态模型与知识的联合推理、语言引导的视觉内容定位、长视频语言描述与问答、跨模态检索、多模态模型的域适应、域泛化与持续学习等。研究成果发表在IJCV、IEEE TIP等重要国际刊物和ICCV、CVPR、ECCV、NeurIPS等重要国际会议上。

多模态表示与推理

研究所对于学生的培养秉承视野国际化、发展个性化、就业多元化的方针，近年来为国内外高校及科研院所、知名公司、大型国企等单位培养了大量的优秀人才。其中，四位博士生获得全国一级学会优秀博士学位论文奖和提名奖。其中吴心筱获得中国人工智能学会优秀博士学位论文奖，杨蛟龙获得中国图像图形学会优秀博士学位论文奖，张小洵获得中国计算机学会优秀博士学位论文提名奖，武玉伟获得中国人工智能学会优秀博士学位论文提名奖。获得微软学者奖1人（徐一华），百度奖学金1人（王文冠），徐特立奖学金多人次（武玉伟等）。研究所大力支持博士生和硕士生出国参加国际一流学术会议，开阔学生的国际视野。研究所指导学生参加中国机器人大赛暨RoboCup机器人世界杯中国赛、睿抗机器人开发者大赛等国家级比赛，获得一等奖13项，二等奖21项，三等奖21项。

吴心筱，杨蛟龙，张小洵和武玉伟获得全国一级学会优秀博士学位论文奖和提名奖

部分学生获奖证书

机器人大赛获奖证书

研究所教师名单

姓名	导师类型	研究领域	邮箱
裴明涛	博导/硕导	计算机视觉，模式识别	peimt@bit.edu.cn
梁玮	博导/硕导	计算机视觉，人机交互，虚拟现实	liangwei@bit.edu.cn
刘峡壁	博导/硕导	机器学习，计算机视觉	liuxiabi@bit.edu.cn
武玉伟	博导/硕导	三维重建，具身智能	wuyuwei@bit.edu.cn
赵清杰	博导/硕导	智能信息处理	zhaoqj@bit.edu.cn
马波	博导/硕导	统计学习，计算机视觉	Bma000@bit.edu.cn
吴心筱	博导/硕导	计算机视觉，多模态表示与学习	wuxinxiao@bit.edu.cn
潘利源	博导/硕导	计算机视觉，智慧医疗	liyuan.pan@bit.edu.cn
李建武	硕导	机器学习，计算机视觉	ljw@bit.edu.cn
张文耀	硕导	模式识别，人工智能，可视化与可视分析	zhwenyao@bit.edu.cn
邸慧军	硕导	计算机视觉，人工智能	ajon@bit.edu.cn