报告嘉宾:张健 (北京大学)
报告时间:2026年1月7日 (星期三)晚上20:30 (北京时间)
报告题目:可信视觉鉴伪大模型
报告人简介:
张健,北京大学长聘副教授、博士生导师,信息工程学院院长助理,视觉信息智能学习实验室 (VILLA)负责人。长期深耕“视觉重建生成与安全”领域研究,已在TPAMI、IJCV、TIP、CVPR、NeurIPS等高水平国际期刊和会议上发表论文120余篇,谷歌学术引用逾1.5万次,其中单篇一作最高引用超1600次,h-index达61;相关开源项目Github星标量破10k;个人连续入选斯坦福全球前2%顶尖科学家“终身科学影响力”以及“年度科学影响力”榜单;6次获国际期刊/会议最佳论文奖、获CVPR NTIRE全球挑战赛冠军、全球AI攻防挑战赛季军;荣获华为MindSpore学术奖励基金项目优秀奖、OPPO产学研“优秀合作伙伴”、广东省卓越人工智能与机器人奖科技进步奖一等奖;主持国家科技重大专项课题、国自然、深圳市重点等科研项目10余项;相关技术成功应用于兔展、字节跳动、OPPO、Stability Al等国内外知名企业的核心产品,多项授权专利完成科技成果转化;担任深圳市人工智能学会青工委主任、JVCIR等国际期刊编委等。
个人主页:
https://jianzhang.tech/
报告摘要:
随着人工智能生成内容 (AIGC)技术的迅猛发展,其在伪造和篡改领域的滥用引发了广泛关注,内容真实性验证与安全防护需求已迫在眉睫。本报告聚焦视觉内容鉴伪领域前沿,深入剖析当前鉴伪技术面临的主要挑战,分享团队在多模态大模型驱动的可解释视觉鉴伪方面的最新研究成果,并对该领域的未来发展趋势进行展望。
参考文献:
[1] Zhipei Xu, Xuanyu Zhang, Runyi Li, Zecheng Tang, Qing Huang, Jian Zhang. FakeShield: Explainable Image Forgery Detection and Localization via Multi-modal Large Language Models, International Conference on Learning Representations (ICLR 2025), Singapore, April, 2025.
[2] Xuanyu Zhang, Zecheng Tang, Zhipei Xu, Runyi Li, Youmin Xu, Bin Chen, Feng Gao, Jian Zhang. OmniGuard: Hybrid Manipulation Localization via Augmented Versatile Deep Image Watermarking, IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2025), Nashville, Tennessee, USA, June, 2025.
[3] Xuanyu Zhang, Youmin Xu, Runyi Li, Jiwen Yu, Weiqi Li, Zhipei Xu, Jian Zhang. V2A-Mark: Versatile Deep Visual-Audio Watermarking for Manipulation Localization and Copyright Protection, ACM International Conference on Multimedia (ACM MM 2024), Melbourne, Australia, Nov. 2024.
[4] Xuanyu Zhang, Runyi Li, Jiwen Yu, Youmin Xu, Weiqi Li, Jian Zhang. EditGuard: Versatile Image Watermarking for Tamper Localization and Copyright Protection, IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2024), Seattle WA, USA, June, 2024.
……