发布日期:2025-09-12 浏览量:
报告题目:面向可控视觉内容生成与编辑的深度生成模型
时间:2025-9-12 11:00
地点:九教北613
主办单位:研究生工作部
承办单位:计算机科学与技术学院
报告人介绍:来煜坤(Yukun Lai),教授,英国卡迪夫大学计算机科学与信息学院,2019–2022年任学院科研主任。目前来教授担任EPSRC生成模型AI研究中心的卡迪夫方负责人,并在其中共同领导“多模态模型”工作组。来教授于2003年、2008年分别获得清华大学学士与博士学位,博士论文获“全国优秀博士学位论文”奖,已在计算机图形学、计算机视觉及相关领域的顶级会议与期刊发表论文100余篇,现任 IEEE Transactions on Visualization and Computer Graphics、Computers and Graphics及The Visual Computer等国际期刊副主编。
报告摘要:近年来,深度生成模型显著降低了视觉内容创作的门槛,用户只需提供极简输入(如一句文本提示)即可生成图像。然而,文本指令往往存在歧义,自动生成的结果时常偏离用户真实意图。虽然可以通过修改提示词重新生成,却无法保证未编辑区域完全不变,也难以实现精细控制。本次报告将介绍近期在“直观、精细可控的视觉内容生成与编辑”方面的系列工作,涵盖图像上色、三维内容生成与编辑等任务;通过引入涂鸦、草图等直观交互,让用户在保持生成质量与效率的同时,获得像素/几何级精细控制。最后,将讨论该方向仍待攻克的若干挑战。