团队介绍:
董伟生团队由董伟生教授/研究员领衔,团队汇聚了计算机视觉方向的10名科研骨干,包括2名教授、3名副教授及10名博士生、35名硕士生,核心成员涵盖计算机科学与技术、新一代电子信息技术等多学科交叉背景。团队聚焦图像视频处理、多模态大模型领域,近三年承担国家部委重大项目、国家优青、重大项目课题等课题,发表TPAMI、IJCV、IEEE-TIP、CVPR、NeurIPS等顶级期刊会议80余篇,获2017年国家自然科学二等奖、2013年陕西省科学技术一等奖。团队与华为、荣耀、海信开展产学研合作,推动图像视频处理技术在手机镜头中的落地应用。
研究方向:
1、多模态感知
面向智能体多模态环境感知与复杂场景理解的应用场景,挖掘深度网络对图像先验知识的表征能力与知识驱动和深度学习融合的技术优势,研究多模态图像先验知识表征、降质过程刻画等具体研究点,突破基于模型不确定性估计的鲁棒深度学习技术新范式,赋能智能装备感知性能提升。
2、具身智能
面向机器人具身智能领域,以视觉语言行动(VLA)为核心切入点,挖掘其融合视觉感知、语言理解与行动规划的潜力,构建多模态算法模型与系统架构,研究环境视觉信息解析、自然语言指令理解及具身行动生成,突破模态融合瓶颈,建立适应性强的智能体决策范式,为服务机器人等领域提供技术支撑。
3、自动驾驶
面向自动驾驶技术的复杂环境感知需求,依托感知增强领域技术积累,聚焦低质场景图像增强、目标识别及三维信息预测,通过智能算法优化提升极端条件下系统的感知与决策能力,同时探索视觉表征在多模态融合、场景理解中的应用,构建更智能安全的自动驾驶系统。