人工智能前沿专题讲座——从多模态感知到具身智能：视觉-语言学习的演进与未来

时间: 2025-10-09 发布者: 邝泉声 文章来源: 学工办 审核人: 李恩秀 浏览次数: 167

人工智能前沿专题讲座

每周五下午2:00-3:30

地点：理工楼103室

时间	9.5	9.12	9.19	10.10	10.24	10.31	11.7	11.21	12.5	12.19
校历周	第1周	2	3	6	8	9	10	12	14	16

#题目从多模态感知到具身智能：视觉-语言学习的演进与未来#

#内容介绍#

人工智能的演进正推动视觉-语言多模态学习成为连接人类感知与机器理解的关键桥梁。本讲座系统梳理该技术的发展脉络与理论基础，阐释其如何赋予机器更全面的世界认知能力。在此基础上，重点探讨视觉-语言多模态学习作为核心基座，在构建具身智能系统中的关键作用——使智能体不仅能感知环境，更能实现在环境中交互与任务执行。讲座还将剖析具身智能落地应用的挑战与机遇，并展望未来研究方向，旨在勾勒从多模态理解到具身智能的发展图景，激发对前沿趋势的深入思考与探讨。

#专家照片#

#专家个人介绍#

　　曹敏，副教授，江苏省“青蓝工程”优秀青年骨干教师，江苏省“双创博士”人才称号，苏州大学优秀青年获得者。江苏省人工智能学会专委工委会秘书长、上海市计算机学会计算机视觉专委会副秘书长，CCF苏州执行委员。于中国科学院自动化研究所获得工学博士学位，研究方向为视觉-语言多模态学习，在本领域顶级会议和期刊上发表论文30余篇，专利授权10余项。主持国家自然科学基金面上和青年项目、江苏省高等学校基础科学研究面上项目、江苏省高等教育教改研究课题、多项国家级与省部级重点实验室开放课题。获得2022-2023年度苏州市自然科学优秀学术论文二等奖，2024年度苏州市人工智能自然科学奖二等奖。