中国图象图形学学会优博论坛邀请历届优博获得者及优秀科研工作者分享前沿研究进展。论坛致力于为青年学者们搭建学术研讨平台,促进青年人才的成长与合作,激励创新性研究,推动中国图像图形学领域的科技进步。本次论坛为第八期优博论坛,由中国图象图形学学会主办,由华中科技大学软件学院、CSIG武汉会员中心、CSIG青工委、CSIG文档图像分析与识别专委会、CSIG成像探测与感知专委会、CSIG青托俱乐部、CSIG优博俱乐部承办,邀请CSIG优博论文获得者与知名学者共10名讲者做学术报告,panel环节探讨如何培养学生做出高水平研究。
一、会议时间
2024年11月3日上午 9:00- 12:10,下午14:00-16:00
二、会议地点
华中科技大学软件学院1002会议室
第八期CSIG优博论坛会议日程
主办单位 中国图象图形学学会 |
承办单位 华中科技大学软件学院 CSIG武汉会员中心 CSIG青工委 CSIG文档分析与识别专委会 CSIG成像探测与感知专委会 CSIG青托俱乐部 CSIG优博俱乐部 |
时间 |
会议安排 |
主持人 |
9:00-9:10 |
领导致辞(白翔教授) |
刘禹良 教授 |
9:10-9:15 |
CSIG优博论坛发展历程介绍 马超 教授(上海交通大学) |
9:15-9:45 |
题目:大模型方法及其垂域应用研究 杜博 教授(武汉大学) |
9:45-10:15 |
题目:通用人工智能时代的OCR 金连文 教授(华南理工大学) |
10:15-10:30 |
茶歇 |
10:30-11:00 |
题目:深度伪造的主动防御与被动检测技术 谢洪涛 教授(中国科学科技大学) |
11:00-11:30 |
题目:多智能体系统的分布式状态估计 苏厚胜 教授(华中科技大学) |
11:30-11:50 |
题目:书生·万象多模态大模型的技术演进与应用探索 王文海 博士后(香港中文大学) |
11:50-12:10 |
题目:跨模态视频动作定位研究 刘婧 副教授(天津大学) |
午餐 |
14:00-14:20 |
题目:视觉多模态融合与感知 徐天阳 副教授(江南大学) |
刘禹良 教授 |
14:20-14:40 |
题目:视觉多模态大模型及其在UI理解中的应用 廖明辉 华为终端BG技术专家 (华为) |
14:40-15:00 |
题目:多模态理解生成的研究与应用 余昌黔 昆仑万维高级算法专家(昆仑万维) |
15:00-15:20 |
题目:多场景自适应图像特征匹配算法研究与应用 蒋兴宇 博士后(华中科技大学) |
15:20-15:50 |
Panel:导师如何在快节奏的当下培养学生做出高水平研究 夏桂松 教授(武汉大学)、马超 教授(上海交通大学)、 张鼎文 教授(西北工业大学)、郑渤龙 教授(华中科技大学)、高常鑫 教授(华中科技大学) |
15:50-16:00 |
会议总结 |
董燕妮 教授 |
报告嘉宾
|
报告人简介:杜博,武汉大学弘毅特聘教授,国家自然科学基金杰出青年科学基金(2022)、优秀青年科学基金获得者(2018),湖北省杰青(2017)。现任国家多媒体软件工程技术研究中心主任、武汉大学发展规划与学科建设办公室主任、武汉大学计算机学院院长、武汉大学人工智能研究院常务副院长、多媒体网络通信工程湖北省重点实验室主任。人工智能领域SCI期刊Neural Networks\Pattern Recognition\Neurocomputing\Neural Processing Letters的Associate Editor,《中国图象图形学报》编委。近五年主持和参与相关纵向研究课题30余项。出版著作3部,发表CCFA类和SCI一区论文100余篇,ESI高引论文28篇,SCI他引12150次,谷歌学术22720次(h指数80)。授权国家发明专利45项,转让5项,授权美国专利5项 报告题目:大模型方法及其垂域应用研究 |
|
报告人简介:金连文,男,华南理工大学二级教授,兼任中国图象图形学学会(CSIG)常务理事、CSIG文档图像分析与识别专委会主任、广东省图象图形学会理事长、广东省高校音视频图文智能信息处理工程研究中心主任等职。主要研究领域为文字识别、文档图像理解、计算机视觉、人工智能与多模态大模型等,在重要学术期刊及国际会议上发表论文200余篇(其中SCI一区+CCF A类论文100余篇),Google Scholar论文被引用数16000余次,H-Index 65。近5年连续入选“斯坦福大学全球前2%顶尖科学家”榜单。2006年入选教育部“新世纪优秀人才”计划。获省部级科技奖5项(其中一等奖2项,二等奖3项);荣获CAAI、CIE、CSIG等全国学会科技进步二等奖3项;指导学生参加CVPR、ICDAR、ICPR、PRCV等国际国内知名会议上的学术竞赛并荣获冠军20余次。 报告题目:通用人工智能时代的OCR |
|
报告人简介:谢洪涛,中国科学技术大学教授、博士生导师,国家杰青、优青,中科院青促会优秀会员。从事人工智能和多媒体内容安全方向的研究,以第一或通讯作者在国际一流期刊和会议上发表学术论文100余篇,担任ACM TOMM等四个国际著名期刊编委。主持科研项目10余项,含国家重点研发计划“网络空间安全治理”重点专项项目1项、国家自然科学基金联合重点项目2项。获2023年度国家技术发明奖二等奖,2019年度国家自然科学奖二等奖,2022年度教育部技术发明奖一等奖,2021年度中国专利奖优秀奖,2018年度中国电子学会自然科学奖一等奖,2022年度中国图象图形学学会青年科学家奖。 报告题目:深度伪造的主动防御与被动检测技术 |
|
报告人简介:苏厚胜,华中科技大学人工智能与自动化学院教授、博士生导师、国家杰出青年科学基金获得者、国家“万人计划”青年拔尖人才,自主智能无人系统教育部工程研究中心副主任。获国家自然科学二等奖(排3)、教育部自然科学一等奖(排2)、湖北省自然科学一等奖(排2)、广东省技术发明奖一等奖(排3),也是科睿唯安全球高被引学者、爱思唯尔中国高被引学者、教育部新世纪优秀人才、湖北省杰出青年基金获得者。主持6项国家自然科学基金,担任科技部人才项目会评专家、国家自然科学基金委信息学部会评专家、香港RGC项目通讯评审专家。发表SCI期刊论文200余篇,其中ESI高被引论文30余篇、IEEE汇刊论文100余篇。担任IEEE Transactions on Systems, Man and Cybernetics: Systems等国际期刊的Associate Editor。 报告题目:多智能体系统的分布式状态估计 |
|
报告人简介:王文海,南京大学博士,香港中文大学博士后,上海人工智能实验室青年科学家,“书生”系列视觉和多模态基础模型核心开发者。研究成果获得了总共超2万次引用,单篇最高引用超4000次。研究成果分别入选CVPR 2023最佳论文,世界人工智能大会青年优秀论文奖,CVMJ 2022最佳论文提名奖。入选斯坦福大学2023-2024年度全球前2%顶尖科学家,CSIG优博提名,世界人工智能大会云帆奖。担任CSIG VI编委,IJCAI 2021的高级程序委员会委员。 报告题目:书生·万象多模态大模型的技术演进与应用探索 |
|
报告人简介:刘婧,天津大学电气自动化与信息工程学院,副教授,天津大学北洋学者青年骨干教师。主要研究方向为多媒体处理和内容理解,曾获得中国图象图形学学会优秀博士学位论文提名奖,天津市科学技术进步特等奖,先后主持国家自然科学基金面上项目及青年项目、中国博士后科学基金特别资助、天津市自然科学基金等项目。发表70余篇期刊及会议论文,谷歌学术引用2000余次,获2021年度IEEE Transactions on Multimedia最佳论文提名奖、2022 年国际数字多媒体通信论坛最佳墙报论文奖等。 报告题目:跨模态视频动作定位研究 |
|
报告人简介:徐天阳,江南大学副教授。博士毕业于江南大学模式识别与智能系统专业,后于Centre for Vision, Speech and Signal Processing (CVSSP)担任Research Fellow,现任江南大学人工智能与计算机学院副教授。研究方向为视频理解,发表期刊与会议论文80余篇,包括CCF-A/IEEE会刊40余篇,其中IEEE TPAMI/IJCV 7篇,谷歌学术引用4000余次,获中国图象图形学学会《优秀博士学位论文奖》,获PRCV2022最佳学生论文奖,获CVPR/ICCV/ECCV等模式识别和计算机视觉国际学术会议举办相关学术竞赛(VOT、MMVRAC、Anti-UAV、AI City Challenge、Perception Test Challenge)冠亚军10余项,入选斯坦福大学全球前2%顶尖科学家2023年度榜单。服务领域内期刊和会议的SAC/AC/PC Member/Reviewer,组织CVPR/ICPR/PRCV/VALSE等大会、竞赛、论坛或讲习班。 报告题目:视觉多模态融合与感知 |
|
报告人简介:廖明辉,博士,华为终端BG技术专家,主要从事视觉多模态大模型、文档智能算法技术研究和落地。发表顶会顶刊论文二十余篇,包括三篇ESI高被引论文。谷歌学术被引用次数超5000次。获得了CSIG优秀博士论文奖、AI华人新星百强、AI 2000 人工智能全球最具影响力榜单、斯坦福大学全球前2%顶尖科学奖榜单、CSIG自然科学奖一等奖、湖北省自然科学奖一等奖、爱思唯尔中国高被引学者等荣誉。 报告题目:视觉多模态大模型及其在UI理解中的应用 |
|
报告人简介:余昌黔,昆仑万维高级算法专家,博士毕业于华中科技大学。研究方向为多模态理解和生成、自动驾驶、计算机视觉。主要成果发表在国际权威期刊和会议 IJCV、CVPR、ICCV、ECCV、NeurIPS 等共32篇论文,其中 8 篇为一作/共一/通讯。Google 学术引用量超过 6300次,单篇最高引用超过 2000 次。研究成果分别入选ECCV2018最具影响力论文TOP10、ESI 高被引论文和热点论文。入选 2022 年度CSIG 优秀博士学位论文奖,2023-2024连续两年入选斯坦福大学全球前2%顶尖科学家。曾担任清华大学计算机系专业实践课程企业指导教师、中国图象图形学报"图像/视频语义分割"专刊特邀编委。曾获得国际重要学术竞赛GigaVision 轨迹预测挑战赛冠军、Argoverse轨迹预测挑战赛冠军、COCO&Mapillary全景分割挑战赛2项冠军。 报告题目:多模态理解生成的研究与应用 |
|
报告人简介:蒋兴宇,华中科技大学博士后,博士毕业于武汉大学电子信息学院,研究方向为多视图几何、3D视觉。在IJCV、IEEE TIP,NeurIPS等国际权威期刊或会议上发表论文10余篇(含ESI热点论文2篇,ESI高被引论文5篇,NeurIPS spotlight论文1篇)。主持国家自然科学基金青年基金和中国博士后面上等项目,入选2023年度中国图象图形学学会博士学位论文激励计划。 报告题目:多场景自适应图像特征匹配算法研究与应用 |
Panel嘉宾
|
夏桂松,武汉大学弘毅特聘教授,博士生导师,国家杰出青年基金获得者。长期从事人工智能、智能无人系统、遥感信息处理等领域的研究工作,以第一/通讯作者在IEEE TPAMI/CVPR/ICCV和IJCV等人工智能顶刊顶会(CCF-A)上发表论文70余篇;在IEEE TMI /TGRS、ISPRS JPRS等人工智能交叉应用学科Top期刊发表论文80余篇;出版专著2部;论文累计被引用22000余次、5篇论文单篇被引超1000次;获IEEE GRSS最有影响力论文奖、湖北自然科学二等奖1项、中国测绘科技进步一等奖3项、Remote Sensing杰出贡献奖等奖励,多项成果应用于国产卫星和天宫二号数据处理、国防安全等国家重要工程项目,并被百度、腾讯、华为等企业采用。 |
|
马超,上海交通大学人工智能研究院教授,博士生导师。国家优青、上海市浦江人才、中国图象图形学学会优博。上海交通大学与加州大学默塞德分校联合培养博士。澳大利亚机器人视觉研究中心(阿德莱德大学)博士后研究员。主要研究计算机视觉和机器学习。谷歌学术引用1万余次,连续入选爱思唯尔中国高被引学者(2020-2023)。任中国图象图形学学会优博俱乐部主席、青年工作委员会副秘书长。担任CVPR 2024/2025、ICLR 2025领域主席,TMM、JAIR、IVC副编辑。获中国图象图形学学会青年科学家奖、MMM 2024唯一最佳论文奖、华为技术合作领域2021年度优秀技术成果奖。 |
|
张鼎文,教授,国家优秀青年科学基金获得者、科睿唯安“全球高被引科学家”,2015赴美国卡耐基梅隆大学进行为期2年的访问研究,致力于建立面向开放环境下、具备动态学习能力的新一代计算机视觉学习框架。迄今为止,作为第一作者/通讯作者在领域内国际重要期刊及会议发表学术论文60余篇,其中包含T-PAMI, IJCV, IEEE SPM, T-IP, CVPR, ICCV, Science China: Information Science等,曾入选中国博士后创新人才计划、AI 华人青年学者榜单, 获吴文俊人工智能优秀青年奖、2021 IEEE TCSVT最佳论文奖、中国图象图形学学会优秀博士论文奖等奖励。担任中国图象图形学学会青年工作委员会副秘书长、VALSE执行领域主席委员会委员,IEEE TMM与TCSVT的首席客座编辑。 |
|
郑渤龙,华中科技大学计算机学院教授、博士生导师,国家高层次青年人才。主要研究方向为大数据管理与分析,在SIGMOD、VLDB、ICDE、VLDBJ、TKDE等重要学术会议和期刊上发表CCF A类论文50余篇。主持国家自然科学基金(面上、中欧人才、青年),国家重点研发计划子课题等。曾获VLDB 2024最佳论文提名奖,VLDB 2020优秀论文,ICDE 2019优秀论文,ACM SIGSPATIAL中国新星奖,华为火花奖等。CCF YOCSEF武汉分论坛主席(2024-2025)。 |
|
高常鑫,华中科技大学教授、全国重点实验室副主任,国家级青年人才。研究领域为计算机视觉、图像/视频智能理解及其在视频监控等领域的应用。近年来发表IEEE TPAMI、IJCV、IEEE TIP、CVPR、ICCV、ECCV等高水平期刊会议论文40余篇。先后主持湖北省杰出青年基金项目、国家自然科学基金面上项目、装备预研项目题等课题。获湖北省科技进步一等奖二等a奖各1项。现任中国人工智能学会模式识别专委会副秘书长、中国图象图形学学会成像探测与感知专委会副秘书长。 |
论坛主席
|
刘禹良,华中科技大学教授、博导。CSIG优博、中国科协青年人才托举工程、教育部海外高层次引才专项、湖北省“百人计划”及华为东湖青年学者。主要从事文字图像智能、视觉语言大模型相关方面研究,近年来在国际期刊和会议如TPAMI/IJCV/CVPR/ACL等视觉与自然语言处理顶刊顶会(CCF-A)发表论文30余篇, 其中一篇论文获ACL最佳论文奖、Monkey多模态大模型入选CVPR亮点论文及最具影响力论文TOP20、10篇一作论文单篇被引超100次。曾获第六/八/十届中国国际”互联网+”大学生创新创业竞赛全国金奖,MLT17、ReCTS、TextVQA等十余项国际权威学术竞赛冠军。主持国家自然科学基金青年项目和两项国家重点研发计划子课题。担任中国科学信息科学客座编委,中国图象图形学学会文档图像分析与识别专委会副秘书长。 |
|
董燕妮,武汉大学资源与环境科学学院教授、博士生导师,国家优秀青年科学基金获得者。主要从事空间数据智能处理与遥感智能解译等方面的研究,已在IEEE TIP、IEEE TCybern、IEEE TGRS和ISPRS等国际刊物上发表SCI检索论文五十余篇,担任SCI期刊IEEE TGRS副主编,IEEE GRSL副主编,ICCV、AAAI等图像分析知名国际会议的高级程序委员会成员,以及IEEE高级会员,IEEE GRSS Wuhan Chapter 副主席,中国图象图形学学会优博俱乐部副主席等;曾获得中国图象图形学学会石青云女科学家奖、中国图象图形学学会优秀博士学位论文提名奖、香江学者奖等;主持国家自然科学基金优青项目、面上项目、青年项目等十余项科研项目。 |