SDCV 2024
第二届山东省计算机视觉大会
第二届山东省人工智能大会
2024年11月1日-3日,山东 · 济南
青年专家论坛
SDCV2024
青年专家论坛(一)
报告题目:三维点云协同智能处理
报告摘要:本三维点云为精细复刻现实物理世界提供了高精度的三维表达方式,成为 继矢量地图和影像数据之后的第三类重要的时空数据源,广泛应用于三维建模、自动 驾驶和智慧城市等领域。由于三维点云的规模庞大、非结构化、密度不均、数据完整 性低等特性,使得点云大数据智能化解译面临着诸多挑战,亟需发展多模型、多目标、 多任务等点云协同智能理论和系统平台。本报告将围绕三维场景感知与理解,汇报课 题组近期在点云自监督 / 弱监督表征学习及点云配准和语义分割等三维点云协同智能处 理方面的研究进展。
报告人:武越(西安电子科技大学)
专家简介:武越,副教授,博士生导师。IEEE/CCF/CAAI 高 级会员。主要研究方向为三维视觉、计算智能等方面的研究。以 第一 / 通讯作者在国际高水平期刊和会议上发表论文 50 余篇,被 引用 3600 余次,连续三年入选全球前 2% 顶尖科学家榜单,10 篇 论文入选 ESI 高被引论文,1 篇论文入选 ESI 热点论文,申请和授 权专利 50 余项。主持国家自然科学基金(重点子课题、面上项目、青年项目)、科技委重点项目子课题、上海航天科技创新基金、 华为横向等项目 20 余项。以第一完成人获陕西省科学技术奖二等奖、吴文俊人工智能 优秀青年奖、华为火花奖、陕西省青年科技新星等学术奖励。
担任 CAAI 青年工作委员会秘书长(2020-2025)、CCF 西安秘书长(2020-2022)、 CCF YOCSEF 西安 主席(2021-2022),Expert Systems with Applications(中科 院一 区 TOP)等 3 个期刊副编辑,Frontiers of Computer Science 和 CAAI Transactions on Intelligence Technology 等 6 个期刊编委,CCF 第六届大数据学术会议的出版副主席、IEEE CCIS2021 组织委员会主席、首届 CCF 黄河论坛程序委员会副主席等。
报告题目:面向复杂场景的换衣行人重识别算法研究
报告摘要:行人重识别是机器学习和计算机视觉领域的重要研究方向,其目标是在不 同的监控摄像头下,准确地识别和匹配行人的身份。在复杂监控场景中行人重识别技 术面临着一系列挑战,包括视角变化、光照变化、行人遮挡和行人外观变化等。本报告将汇报课题组近年来在换衣行人重识别上的相关成果。
报告人:高赞(山东省人工智能研究院)
专家简介:高赞,山东省人工智能研究院研究员,博导,国家青年人才计划人选、山东省突贡专家,全球前2%顶尖科学家,省部级创新团队“智能媒体分析与视觉感知”负责人,主要研究领域包括多媒体理解与分析,计算机视觉以及多媒体内容安全等。
近年来,主持或参与包括国家自然基金重点和国家重点研发等省部级以上课题20余项,曾获山东省科技进步一等奖、山东省技术发明一等奖和天津市科技进步二等奖各1项,在包括TPAMI和CVPR等国际会议和期刊发表论文100余篇,其中ESI高被引论文6篇、热点论文1篇。2021年获CCF A类会议SIGIR最佳学生论文,中国博士后基金会学术论文一等奖,授权发明专利50余项,其中国际专利3项,成功转化7项。
目前兼任IEEE高级会员,中国计算机学会杰出会员、中国图形图象学会高级会员,中国计算机学会多媒体技术专委会、计算机专委会执行委员,山东省人工智能学会常务理事,山东省人工智能学会青年科学家委员会副主任,同时,受邀担任20余个国际知名期刊和会议的领域主席、程序委员会委员和审稿人,获得ChinaMM2019、PCM 2018的杰出审稿人,担任Neural Network,TOMM,CAAI TIT等多个国际期刊的副编辑或青年编委。
报告题目:面向视频分类的事件级视觉特征建模方法
报告摘要:视频分类是计算机视觉领域的传统任务,旨在使用机器学习算法对视频帧进行处理、表示和类别预测。与图像分类不同,视频的类别特征除了视觉目标、会包含目标的交互和行为信息,例如“修理自行车”、“爬山”和“聚会”,因此简单迁移图像分类的算法思路到视频分类任务会导致难以区分场景相近的类别,比如“爬山”和“野餐”。这是因为现有视频分类算法通常使用基于Transformer的编码器将所有视频帧作为整体进行特征学习,使得学习到的特征主要来自帧中的物体目标,忽略了物体目标间的时序交互信息;此外,物体目标在不同类别下不同的主次关系也会影响算法模型对特征的学习质量。
为了解决这个问题,本文提出了一种事件级因果表示学习(ECRL)模型,用于时空建模帧内物体的交互以及它们的跨帧时间关联。具体而言,ECRL首先采用了帧到视频因果建模(F2VCM)模块,该模块同时构建包含背景和前景信息的帧内因果图,并通过建模它们的跨帧关联来构建视频级因果图。随后,引入了因果感知的事件级表示推理(CERI)模块,通过分别采用后门和前门干预,消除上下文和物体的虚假关联。前者涉及视觉上下文去偏,过滤掉背景干扰因素,而后者采用全局-局部因果注意力来捕捉事件级的视觉信息。在两个基准数据集上的实验结果验证了ECRL可以更好地捕捉跨帧关联、以事件级特征来描述视频。
报告人:孟雷(山东大学)
专家简介:孟雷,教授、博导,2020年起就职于山东大学软件学院,齐鲁青年学者(第一层次),山东省泰山学者青年专家,入选2021年度中国工程院中国工程前沿杰出青年学者,济南市“新高校20条”引进创新团队负责人。长期从事面向多模态数据表征的机器学习应用理论与技术研究。出版Springer专著一部,在MM、SIGGRAPH、AAAI、IJCAI、TKDE、TOIS等领域权威期刊会议发表论文70余篇,谷歌引用3000余次。研究成果入选中国通信学会未来网络领先创新科技成果,获中国发明协会发明创新奖一等奖、山东计算机学会科技进步二等奖、ACM济南分会新星奖、山东省人工智能优秀青年奖。主持国家自然科学基金青年基金、国家重点研发计划课题、山东省优青等项目。担任中科院SCI一区期刊《Applied Soft Computing》副主编,CSIG青工委、CCF多媒体专委、CAAI具身智能等专委会执行委员、YOCSEF济南分论坛主席(2023-2024届)。
报告题目:基于正交矩水印的Deepfake主动检测
报告摘要:随着深度学习技术的快速发展,深度伪造技术(Deepfakes)已经能够以较低的成本生成逼真的伪造视频和图像,这对个人隐私、国家安全和社会信任构成了严重威胁。这种技术可以用于制造虚假新闻、进行政治诽谤、制作非自愿的色情内容等,对社会秩序和个人权益产生破坏性影响。本报告分享一基于正交矩水印的Deepfake主动检测框架。该框架通过结合正交矩水印嵌入技术和深度学习来实现。研究者们将水印嵌入和提取视为两个独立的过程,首先在正交矩幅值中嵌入水印信息以增强对常规攻击的鲁棒性并确保水印的不可感知性,然后提出一个双重任务级联检测框架,以更准确地识别水印嵌入区域,并通过两个任务之间的知识蒸馏提高模型在常规攻击下准确提取水印和检测深度伪造的能力。
报告人:王春鹏(齐鲁工业大学)
专家简介:博士,副教授,硕士生导师,全球前2%顶尖科学家、山东省泰山学者青年专家、山东省高校青年创新团队负责人、山东省优秀研究生导学团队核心成员、山东省黄大年式教学团队核心成员。已发表SCI论文110余篇(入选ESI热点论文1篇、ESI高被引论文6篇),论文总被引用3100余次;授权本领域国家发明专利25项;主持省部级及以上科研项目10余项。获山东省自然科学二等奖1项、山东省科技进步二等奖1项、辽宁省科技进步二等奖1项、中国防伪行业协会防伪科学技术一等奖1项、济南市自然科学学术创新奖(成果类)一等奖2项。
报告题目:基于深度学习的视频编码
报告摘要:视频编码是视频处理和通信的基础问题。随着深度学习的飞速发展,基于深度学习的图像/视频编码受到了广泛关注,并取得了显著进展。在本报告中,我们将首先回顾基于深度学习的视频编码的最新进展,包括深度学习增强的视频编码和可学习视频编码,然后介绍我们团队在该领域的贡献。在深度学习增强的视频编码中,利用深度学习对传统视频编码进行增强,包括对混合视频编码框架内的模式决策、预测等各个模块进行增强,以及直接对重建输出进行后处理等改进。这些技术可以作为人工智能增强模式实施,并与现有的视频编码标准兼容。相反地,可学习视频编码采用深度学习框架,完全取代传统的手工视频编码模块。尽管是一种完全基于深度学习的方法,但可学习视频编码中的每个模块仍然遵循与传统对应模块相似的设计和功能,例如运动估计和补偿子网络以及基于超先验的熵编码上下文模型。在本报告中,我们将讨论传统视频编码和基于深度学习的视频编码之间的差异,突出深度学习给该领域带来的新机遇。
报告人:李帅(山东大学)
专家简介:李帅,山东大学,控制科学与工程学院,教授,齐鲁青年学者。致力于高效视频编码及分析、计算机视觉及人工智能的研究,已发表国际期刊及会议论文60余篇。近五年荣获2次国际学术会议(IEEE BMSB和IIH-MSP)最佳论文奖,并荣获IEEE Transactions on Broadcasting最佳论文奖提名,2篇论文入选ESI Highly Cited Paper(高被引论文),荣获国际竞赛SHL Challenge亚军将。多次担任国际会议领域主席包括IEEE ICME 2021 Session/Area Chair、 ACM MM 2021 Session Chair、 PRCV 2023 Session Chair,现为多个IEEE及Elsevier期刊的审稿人及多个国际会议的审稿人。已提交国际及国家视频编码标准技术提案8项,其中3项被国际和国家标准组织采纳,且被集成到相关视频编码标准的参考软件中。代表性工作独立循环神经网络(IndRNN)获得谷歌及国际多位知名专家引文的肯定,包括图灵奖共同得主之一Yoshua Bengio,单篇引用1000+次,并被集成到多个深度学习软件库中包括TensorFlow。
报告题目:面向自然场景的人脸鉴伪技术初探
报告摘要:近年来,人脸鉴伪技术取得了显著进展,在多个公共数据基准上表现出色。然而,这些方法在自然场景中的应用存在明显局限性,严重影响人脸鉴伪技术的实用性,这也是当前人脸鉴伪领域的一大痛点。本报告首先介绍自然场景中存在的挑战,然后介绍本人在轻量化、可泛化、安全性三个方面的一系列探索,旨在构建适用于自然场景的人脸鉴伪体系。最后介绍对人脸鉴伪方向的一些思考与展望。
报告人:李岳尊(中国海洋大学)
专家简介:李岳尊,中国海洋大学,硕士生导师,本硕毕业于山东大学,博士毕业于美国纽约州立大学奥尔巴尼分校。曾任纽约州立大学布法罗分校高级研究科学家。研究方向主要包括多媒体取证、深度模型安全和计算机视觉,研究成果发表于NeurIPS, ICCV, CVPR, ECCV, TIFS等多个国际顶级会议和期刊,谷歌学术引用6400余次,多篇论文的单篇学术引用超过1000次, 其中WIFS18的工作曾被CCTV13《世界周刊深度伪造专题》报道 [7:43]。担任TPAMI, TIP, IJCV, TIFS, ICCV, CVPR, AAAI, NeurIPS, ICLR等多个国际顶级期刊和会议的审稿人。主持国家自然科学青年基金、山东省自然科学青年基金、博士后面上项目和站前特别资助项目、中央高校基本科研业务费、青岛市博士后项目等多个项目。入选2024全球前2%顶尖科学家榜单,并获得2024年ACM新星奖。详见https://yuezunli.github.io/
报告题目:面向多媒体数据的Logo识别与检测
报告摘要:随着互联网和大数据技术发展,多媒体数量呈爆炸式增长,给版权保护和品牌监管带来新的挑战, 开展Logo自动识别与检测是应对这一挑战的有效途径。受限于现有Logo数据集规模小、类别少以及Logo自身特点,现有通用目标检测方法用于Logo检测时效果不佳。我们从Logo大规模数据集构建着手,对Logo的自动检测的关键技术开展系列研究,预期为互联网中视频广告的有效检索、品牌监管和智能分析提供理论指导和技术支撑。
报告人:侯素娟(山东师范大学)
专家简介:侯素娟,山东师范大学信息科学与工程学院准聘教授、东岳学者青年人才,围绕目标检测和识别、多媒体信息处理等方向展开研究,目前在IEEE TMM、IEEE TNNLS、Pattern Recognition、ACM TOMM、AAAI、ACM Multimedia、ICASSP等期刊和会议上发表论文50余篇,授权专利5项,主持国家自然科学基金3项,作为主要参与人获2022年山东省科技进步一等奖、山东省科技工作者创新大赛二等奖。
报告题目:点集配准技术在手术导航系统中的应用进展
报告摘要:手术导航系统已经成为外科手术朝着微创化、精准化、个性化方向发展不可或缺的手术设备,能够帮助医生更好地完成术前规划、术中模拟和术中导航等任务。目前,临床普遍采用基于标记点的点集配准技术完成导航中空间配准这一关键步骤,这非常依赖临床医生的经验、费时费力且存在手工误差。针对上述存在的问题,本次报告将从无标记点的技术路线出发,结合本团队的相关研究分享点云配准技术及其在手术导航中应用的相关进展,主要包括基于传统优化方法的可解释点集配准、基于深度学习的快速点集配准、二维影像与三维影像之间的点集配准、三维影像与三维影像之间的点集配准等方面。
报告人:傅科学(山东省计算中心)
专家简介:傅科学,山东省计算中心(国家超级计算济南中心),副研究员,泰山学者青年专家。2023年毕业于复旦大学数字医学研究中心并获得工学博士学位,长期从事点云配准、手术导航和三维视觉领域的研究工作,作为第一作者在 IEEE TPAMI、IEEE TII、IEEE TCSVT、CVPR、ICCV、NeurIPS等国际顶级期刊和会议上发表高质量研究论文30余篇,受到国际同行的一致好评,文章先后被院士、IEEE Fellow、ACM Fellow和国家杰青等团队多次引用。
青年专家论坛(二)
报告题目:面向临床诊疗的多模态医学数据融合分析
报告摘要:本报告将围绕我们团队与临床合作的研究工作,介绍人工智能以及AI or Science在智慧诊疗中的应用,尤其针对心血管疾病和肿瘤等重大疾病的临床诊疗。重点展示基于多模态医学影像及医疗大数据融合分析的研究进展,并探讨在大模型时代背景下的发展趋势。
报告人:王烁(复旦大学)
专家简介:王烁,现任复旦大学数字医学研究中心青年研究员,博士生导师,上海市领军人才(海外),兼任英国伦敦帝国理工学院荣誉资深研究员,中国计算机学会数字医学分会执行委员,上海市力学学会生物力学专委会委员,上海市医学会数字医学专科分会委员,上海市内镜微创协同创新中心首席研究员, BioMedical Engineering Online 等杂志副主编。具备丰富的医工交叉研究经历(复旦大学理论与应用力学专业学士+剑桥大学放射学专业博士+剑桥大学数学系/帝国理工数据科学研究所博士后),主要研究领域为多模态医学人工智能及其临床应用。迄今在医工领域发表文章 50 余篇,包括医学领域国际期刊 Nature Medicine、医学影像期刊 Radiology 和人工智能会议CVPR等。
报告题目:浅谈AIGC如何助力企业实践及产业应用落地
报告摘要:本报告将围绕中国联通在大模型技术应用领域的能力介绍,尤其在行业落地过程中的行业大模型的技术路线,并探讨行业大模型作为“人工智能+”落地的关键技术应用,构建行业大模型的不同实现方式和路线,以及中国联通行业大模型案例应用。
报告人:胡超(联通(上海)产业互联网有限公司)
专家简介:胡超,上海联通资深技术总监、上海联通人工智能实验室博士专家;聚焦机器视觉、自然语言处理,大模型领域的研究工作,曾担任阿里巴巴达摩院人工智能实验室高级算法专家; 上海市城市数字化转型“智慧工匠”、中国联通科技委员会数智技术专家、上海市人工智能行业协会专家、江苏省专业技术拔尖人才、 江苏省侨联特聘专家;在CVPR、IEEE TIP等国内外重要期刊会议发表学术论文30余篇。
报告题目:面向计算机辅助手术的配准方法研究
报告摘要:术前-术中配准是决定计算机辅助手术精度的关键步骤。在本报告中,我将介绍在术前术中刚性和非刚性三维配准方面的研究工作。面向骨科手术导航等应用场景,我们提出了基于深度学习的特征辅助刚性点云配准算法,其通过引入法向量信息、重叠度分数和采用双向配准策略,试图解决噪声和奇异点、部分到整体等挑战性问题。面向超声引导前列腺癌靶向穿刺手术等应用场景,基于物理信息神经网络,我们提出了考虑组织形变生物力学约束的端到端非刚性配准框架,并在核磁共振到超声图像配准病人数据上进行了验证。
报告人:闵哲(山东大学)
专家简介:闵哲,山东大学教授、博士生导师,国家海外高层次青年人才,山东大学杰出中青年学者(第一层次),伦敦大学学院荣誉讲师。2014年于山东大学控制科学与工程学院获学士学位,2019年获得香港中文大学电子工程学哲学博士学位(师从加拿大工程院院士孟庆虎教授),2019年至2023年先后于香港中文大学和伦敦大学学院开展博士后研究。现主持国家海外优青项目、国自然青年基金等科研项目。共发表学术论文60篇,现担任IEEE TASE和IEEE RAL副主编、《机器人》青年编委, 主要研究方向为医疗机器人与人工智能。
报告题目:对抗训练在领域自适应研究中的应用新思路
报告摘要:针对迁移学习中常见的领域漂移问题,领域自适应技术旨在减小源域与目标域的数据分布差异,使基于源域数据训练的模型能够在目标域上实现良好的泛化,从而促进领域不变知识的跨域迁移与复用。对抗训练作为领域自适应的经典策略,通过在特征提取器和领域判别器之间进行对抗,促使特征提取器生成领域不变特征,进而实现源域与目标域的对齐。本报告汇报课题组近期在对抗训练应用上的新进展:一方面,针对无源领域自适应问题,我们通过对抗训练将样本生成阶段与模型自适应阶段整合到统一框架中,显著提升了模型的收敛效率;另一方面,针对视觉语言模型的自适应问题,我们将对抗训练融入提示学习,在不依赖显式领域判别器的条件下同时实现了全局与类别层面的域对齐,使模型展现出卓越的跨域迁移能力。
报告人:崔超然(山东财经大学计算机科学学院)
专家简介:崔超然,三级教授,博士生导师,山东省泰山学者青年专家。主要研究兴趣为机器学习、数据挖掘、多媒体信息处理。目前,在国内外重要学术会议及期刊上发表论文70余篇。作为学术带头人,牵头组建山东财经大学机器学习与大数据分析团队,并入选山东省高等学校优势学科人才团队培育计划。先后主持国家自然科学基金项目2项、国家重点研发计划子课题1项、山东省自然科学基金项目1项,授权国家发明专利12项,获得山东省科技进步奖二等奖(第二完成人)。教育教学方面,主持山东省本科教学改革研究重点项目,获得山东省人工智能学会教学成果特等奖,指导学生获得“挑战杯”中国大学生创业计划竞赛银奖等奖项。被共青团山东省委授予“山东省青年岗位能手”荣誉称号,获得山东省人工智能优秀青年奖,入选山东财经大学卓越人才支持计划。作为柔性引进人才,担任浪潮通用软件有限公司首席科学家。目前担任山东省人工智能学会常务理事、中国计算机学会人工智能与模式识别专委会执行委员、中国计算机学会计算机视觉专委会执行委员。
报告题目:跨设备手指静脉识别
报告摘要:在嵌入式应用环境中,终端设备更新换代为手指静脉识别带来了新的挑战。不同嵌入式手指静脉采集设备在成像光源、成像面积等方面存在很大的不同,导致了跨设备手指静脉识别问题。本报告分享研究团队在跨设备手指静脉识别方面的研究进展,包括一种基于迁移学习的跨光源手指静脉识别方法、一种基于细节点的跨面积手指静脉识别方法和一种小面积手指静脉识别方法。
报告人:杨璐(山东建筑大学)
专家简介:杨璐,山东建筑大学教授,硕士生导师,山东省泰山学者青年专家。主要从事手指静脉识别、生物特征识别、机器学习及应用等方面的研究工作。主持国家自然科学基金面上项目1项、青年项目1项,主持山东省高等学校青创团队计划1项。在IEEE TIFS、IEEE TCSVT、国际生物识别会议等期刊和会议上发表学术论文20余篇。目前担任山东省人工智能学会理事、中国人工智能学会机器学习专委会通讯委。