以习近平新时代中国特色社会主义思想为指导,全面贯彻落实党的二十届三中全会精神和全国教育大会精神,为了促进学术交流创新,拓宽学术视野,助力人才培养成长,增强学院学术氛围,激发科研热情,提升学院整体学术活跃度与影响力,促进学科建设与发展,特举办宝鸡文理学院计算机学院第四届“多模态智能与高性能计算”博士学术论坛。
现将具体安排通知如下:
时间:2025年1月16日(星期四)08:30——12:00
地点:石鼓校区教学主楼524
腾讯会议:257 968 555
学术论坛具体安排
时间 |
内容 |
|
08:30—09:00 |
多模式条件驱动的视觉内容生成与编辑 |
李冠彬博士 |
09:00—09:30 |
多模态增强3D感知以及内窥镜感知应用 |
李镇博士 |
09:30—10:00 |
基于FPGA的阵列信号处理算法中关键矩阵算子的高性能实现研究 |
闫迪博士 |
10:00—10:30 |
多粒度级联融合下的漏斗图神经网络设计用于病毒性心肌炎蛋白质相互作用预测 |
张平博士 |
10:30—11:00 |
复杂环境下路面裂缝图像智能检测与精确分割研究 |
李宏霞博士 |
11:00—11:30 |
被动雷达中矩阵算子的工程解读 |
张晓伟博士 |
11:30—12:00 |
学术交流 |
报告人:李冠彬,中山大学教师,博士。
简介:李冠彬,中山大学计算机学院教授,博士生导师,国家优秀青年基金获得者。主要研究领域为跨模态视觉感知、理解与生成。迄今为止累计发表CCF A类/中科院一区论文180余篇,Google Scholar引用超过14600次。曾获得中国图象图形学学会青年科学家奖、吴文俊人工智能优秀青年奖、ACM中国新星提名奖、中国图象图形学学会科学技术一等奖、ICCV2019最佳论文提名奖、CVPR2024最佳论文候选、ICMR2021最佳海报论文奖等荣誉。主持了包括国自然优青、面上、青年、广东省杰青、CCF-腾讯犀牛鸟科研基金、CCF-快手科研基金、华为Mindspore学术基金、美团北斗科研合作基金等10多项科研项目。担任CSIG青工委副秘书长、广东省图象图形学会计算机视觉专委会主任、CCF YOCSEF广州主席、广州计算机学会副秘书长、VALSE执行副主席等。担任CVPR、ECCV、AAAI等顶级会议领域主席(AC)或高级程序委员。担任The Visual Computer编委,获得8项CVPR、NeurIPS、ACM MM等国际顶级会议竞赛冠军。
报告题目:多模式条件驱动的视觉内容生成与编辑
报告摘要:近年来,以扩散生成模型为代表的生成式AI模型能力日新月异,展现出令人瞩目的效果。在视觉内容生成及编辑领域,更符合用户意图及更具可控性的跨模态生成方法受到了学术界及产业界的广泛关注。已有的跨模态视觉生成方法在图像生成质量、美学感染力、跨模态结构及语义对齐、跨帧及多视角一致性等方面仍然存在诸多挑战。本次报告将围绕多模式条件驱动的可控视觉内容生成与编辑问题,介绍研究组从感知反馈学习、视频自监督一致性约束、蒸馏采样一致性、隐式参数对齐等角度实现用户意图一致的图像生成、视频虚拟试穿、图文提示引导的3D场景编辑以及多模式控制的数字人生成等方面的研究成果及相关应用。
报告人:李镇,香港中文大学(深圳),博士
简介:李镇博士现任香港中文大学(深圳)理工学院助理教授,未来智联网络研究院助理院长,校长青年学者。李镇博士获得香港大学计算机科学博士学位(2014-2018年),他还于2018年在芝加哥大学担任访问学者。李镇博士荣获2023年吴文俊人工智能优秀青年,2021年中国科协第七届青年托举人才,2023CVPR HOI4D竞赛第一名,2022年SemanticKITTI语义分割竞赛第一名,2023年IROS最佳论文Finalist,ICCV2021 Urban3D竞赛第二名,CASP12接触图预测全球冠军等。李镇博士还获得了来自于国家、省市级以及工业界的科研项目。李镇博士领导了港中深的Deep Bit Lab,其主要的研究方向是3D视觉解析及应用(包括但不限于点云解析,多模态联合解析),深度学习等基础理论算法研究,并致力于将2D/ 3D人工智能算法推广应用于交叉学科,自动驾驶,工业视觉等场景中,在该方向著名国际期刊和会议发表论文80余篇,包括顶级期刊Cell Systems, Nature Communications, T-PAMI, IJCV, TMI, TVCG, TNNLS等,以及顶级会议CVPR, ICCV, ECCV, NeurIPS, ICLR, IROS, ACM MM, AAAI, IJCAI, MICCAI等。李镇博士担任IEEE Transactions on Mobile Computing、IROS副编、ICLR2024 AC以及众多顶刊顶会的审稿人,李镇博士还是广东院士联合会脑科学与类脑智能专委委员,VALSE、MICS、CSIG青工委,MV专委会,3DV专委会等学术组织的委员。
报告题目:多模态增强3D感知以及内窥镜感知应用
报告摘要:点云作为一种基本的三维表示形式,在自动驾驶、具身智能(Embodied AI)、医学图像以及生物分子结构预测与设计等多种任务中发挥着重要作用。尽管三维感知技术已经取得了显著的发展,但多模态增强的三维感知仍然是迫切需求,尤其是结合大语言模型(LLM)和视觉语言模型(VLM)。本报告从点云感知出发,我们首先研究了点云形状分类、点云三维检测与跟踪、大场景三维语义分割、占用预测与重建等经典任务,并从单一模态拓展到多模态。我们的算法在许多国际公开竞赛中取得了优异成绩。最后,我们将增强的多模态三维感知技术扩展应用到内窥镜的医学影像分析中,为医生临床提供了可能的解决方案。
报告人:闫迪,宝鸡文理学院计算机学院教师,博士。
简介:闫迪,博士,毕业于长安大学智能交通与信息系统工程专业,主要从事高性能计算、图像处理、人工智能等研究方向。主要研究课题包括围绕阵列信号处理中关键矩阵算子的高性能实现,以及基于深度学习的骨料图像处理等。在IEEE Transaction on Circuits and System等国内外期刊发表学术论文10篇,参与多项国家自然科学基金项目、陕西省科技厅项目。
报告题目:基于FPGA的阵列信号处理算法中关键矩阵算子的高性能实现研究
报告摘要:雷达在自动驾驶领域发挥着至关重要的作用,其中阵列信号算法的处理结果是决定自动驾驶安全性能的关键要素之一。通常阵列信号以矩阵形式呈现,并且阵列信号处理算法主要包括矩阵求逆、矩阵分解和矩阵变换三大关键矩阵算子。这三大关键矩阵算子的计算量较大,其运算性能对自动驾驶系统的影响巨大。虽然对这三大关键矩阵算子的硬件实现已有大量的研究成果,但是随着科学技术及交叉领域的快速发展,对它们的运算性能提出了更高的要求,其高性能计算实现依然是相对热门和重点的研究方向之一。由于FPGA具有比其他硬件平台更为独特的优势,比如丰富的逻辑资源、基于底层的设计、能效比高、并行性高、可靠性高以及更适合于移动终端等。因此本文基于FPGA的硬件平台,就这三大矩阵算子的高性能实现分别展开了深入的研究分析。
报告人:张平,宝鸡文理学院计算机学院教师,博士。
简介:张平,博士,宝鸡文理学院计算机学院专任教师,CCF会员。主要从事深度学习、生物信息学、知识图谱、图挖掘、信息融合等领域的研究。中国计算机学会(CCF)会员,先后在《Expert Systems With Applications》、《Knowledge-Based Systems》、《Applied soft computing》、《Briefings in Bioinformatics》、《BMC Genomics》、《IEEE/ACM Transactions on Computational Biology and Bioinformatics》、《BMC Bioinformatics》、《Interdisciplinary Sciences: Computational Life Sciences》、《ACS Omega》等国际期刊发表论文20余篇。担任多个SCI期刊的审稿人,并被邀请担任BIBM2023/BIBM2024的技术计划委员会成员、BDDM2024国际会议Workshop Chair。作为项目负责人主持陕西省教育厅自然科学专项计划项目1项,横向项目1项。作为核心成员参与陕西省科技厅工业攻关项目2项。
报告题目:多粒度级联融合下的漏斗图神经网络设计用于病毒性心肌炎蛋白质相互作用预测
报告摘要:鉴定人与病毒间潜在的蛋白质-蛋白质相互作用(PPI)对于在分子水平上理解病毒感染和疾病机制至关重要。最近,图神经网络(GNN)已经成为一种有前途的方法来加快PPI鉴定。然而,GNN在捕获高阶邻居信息时往往存在过度平滑的问题。为了解决这一问题并有效地从多跳邻居中捕获隐含的协作信息,我们提出了FGNN,一种多粒度信息级联融合的漏斗图神经网络,以类似漏斗的方式促进信息的蒸馏。具体来说,它支持将信息流从全图映射到子图,并最终映射到节点。通过将子图视为连接高阶邻居的桥梁,保证了多跳邻居在同一子空间中的投影,从而实现了全图到子图的有效映射。此外,我们还设计了一种配备多头注意力机制的编码器来有效地将子图映射到节点,使得从高阶邻居中获得的信息可以进一步被细化和压缩。FGNN可以有效地捕获高阶邻居信息,同时消除GNN的过度平滑现象。大量的实验表明,FGNN在AUC评估指标上优于最先进的方法。在四套病毒诱发的心血管疾病数据集上的性能提升率分别为7.96%、2.3%、2.49%和0.82%。
报告人:李宏霞,宝鸡文理学院计算机学院教师,博士。
简介:李宏霞,长安大学智能交通与信息系统工程专业博士,主要从事人工智能、计算机视觉、模式识别与图像处理方向的研究。宝鸡市高新区、校级创新创业团队导师,宝鸡市企业科技创新服务团专家。在国内外公开发行刊物Construction and Building Materials、Journal of Traffic and Transportation Engineering (English Edition)等发表学术论文3篇,其中中科院SCI一区论文1篇,中科院SCI二区论文2篇,获国家专利2项,软著4项。先后主持参与国家自然科学基金项目、陕西省科技厅项目、陕西省教育厅项目等6项及多项横向科研课题,并指导多项省级大创项目。
报告题目:复杂环境下路面裂缝图像智能检测与精确分割研究
报告摘要:公路基础设施维护对交通顺畅与经济发展意义重大,路面裂缝检测更是保障道路安全、延长寿命的关键。但复杂环境下光照、阴影、背景干扰多,传统路面裂缝检测方法难满足高精度、高效路面裂缝的需求。因此,研发能在复杂环境下高效工作的路面裂缝智能检测系统,成为公路养护管理领域亟待解决的关键问题。本文围绕复杂环境下路面裂缝智能检测与精确分割开展研究,结合深度学习、图像处理技术及实时轻量化策略,旨在解决光照变化、阴影遮挡及复杂背景下的路面裂缝图像检测难题,力求实现路面裂缝图像高精度实时检测。
报告人:张晓伟,宝鸡文理学院计算机学院教师,博士。
简介:张晓伟,博士,高级工程师,2014年毕业于西安电子科技大学,2014年10月~2024年11月曾就职于陕西黄河集团有限公司,2024年12月起就职于宝鸡文理学院计算机学院。读博期间参与多个国家自然科学基金课题,装发“十一五”XXX预研课题;工作期间,作为重要人员参与多个型号雷达产品研制。主要研究方向:高性能并行计算;基于FPGA的算法设计和嵌入式软硬件架构设计。
报告题目:被动雷达中矩阵算子的工程解读
报告摘要:以被动雷达为背景,解读被动雷达中所用到数学工具,其中矩阵特征分解是被动雷达的信号处理中极化MUSIC算法的核心算子之一,基于实测数据,阐述了在实际工程中,不同矩阵特征分解算法的效果以及系统的角度考虑矩阵特征分解。矩阵分解作为矩阵变换的一种重要工具,快速傅里叶变换(FFT)亦可通过矩阵分解来解读;排序也可以通过矩阵变换来完成;等等。最后,我们探讨了分析被动雷达未来的技术发展趋势。