人工智能前沿专题讲座——从多模态感知到具身智能:视觉-语言学习的演进与未来
时间: 2025-10-09 发布者: 邝泉声 文章来源: 学工办 审核人: 李恩秀 浏览次数: 10

人工智能前沿专题讲座

每周五下午2:00-3:30

地点:理工楼103室

时间

9.5

9.12

9.19

10.10

10.24

10.31

11.7

11.21

12.5

12.19

校历周

第1周

2

3

6

8

9

10

12

14

16


#题目 从多模态感知到具身智能:视觉-语言学习的演进与未来#

#内容介绍#

人工智能的演进正推动视觉-语言多模态学习成为连接人类感知与机器理解的关键桥梁。本讲座系统梳理该技术的发展脉络与理论基础,阐释其如何赋予机器更全面的世界认知能力。在此基础上,重点探讨视觉-语言多模态学习作为核心基座,在构建具身智能系统中的关键作用——使智能体不仅能感知环境,更能实现在环境中交互与任务执行。讲座还将剖析具身智能落地应用的挑战与机遇,并展望未来研究方向,旨在勾勒从多模态理解到具身智能的发展图景,激发对前沿趋势的深入思考与探讨。

#专家照片#

#专家个人介绍#

  曹敏,副教授,江苏省“青蓝工程”优秀青年骨干教师,江苏省“双创博士”人才称号,苏州大学优秀青年获得者。江苏省人工智能学会专委工委会秘书长、上海市计算机学会计算机视觉专委会副秘书长,CCF苏州执行委员。于中国科学院自动化研究所获得工学博士学位,研究方向为视觉-语言多模态学习,在本领域顶级会议和期刊上发表论文30余篇,专利授权10余项。主持国家自然科学基金面上和青年项目、江苏省高等学校基础科学研究面上项目、江苏省高等教育教改研究课题、多项国家级与省部级重点实验室开放课题。获得2022-2023年度苏州市自然科学优秀学术论文二等奖,2024年度苏州市人工智能自然科学奖二等奖。