人工智能前沿专题讲座——从多模态感知到具身智能:视觉-语言学习的演进与未来
时间: 2025-10-09
发布者: 邝泉声
文章来源: 学工办
审核人: 李恩秀
浏览次数: 10
人工智能前沿专题讲座
每周五下午2:00-3:30
地点:理工楼103室
时间 | 9.5 | 9.12 | 9.19 | 10.10 | 10.24 | 10.31 | 11.7 | 11.21 | 12.5 | 12.19 |
校历周 | 第1周 | 2 | 3 | 6 | 8 | 9 | 10 | 12 | 14 | 16 |
#题目 从多模态感知到具身智能:视觉-语言学习的演进与未来#
#内容介绍#
人工智能的演进正推动视觉-语言多模态学习成为连接人类感知与机器理解的关键桥梁。本讲座系统梳理该技术的发展脉络与理论基础,阐释其如何赋予机器更全面的世界认知能力。在此基础上,重点探讨视觉-语言多模态学习作为核心基座,在构建具身智能系统中的关键作用——使智能体不仅能感知环境,更能实现在环境中交互与任务执行。讲座还将剖析具身智能落地应用的挑战与机遇,并展望未来研究方向,旨在勾勒从多模态理解到具身智能的发展图景,激发对前沿趋势的深入思考与探讨。
#专家照片#

#专家个人介绍#
曹敏,副教授,江苏省“青蓝工程”优秀青年骨干教师,江苏省“双创博士”人才称号,苏州大学优秀青年获得者。江苏省人工智能学会专委工委会秘书长、上海市计算机学会计算机视觉专委会副秘书长,CCF苏州执行委员。于中国科学院自动化研究所获得工学博士学位,研究方向为视觉-语言多模态学习,在本领域顶级会议和期刊上发表论文30余篇,专利授权10余项。主持国家自然科学基金面上和青年项目、江苏省高等学校基础科学研究面上项目、江苏省高等教育教改研究课题、多项国家级与省部级重点实验室开放课题。获得2022-2023年度苏州市自然科学优秀学术论文二等奖,2024年度苏州市人工智能自然科学奖二等奖。