国家卓越工程师学院

“与大师面对面”名师讲坛（2025-9-12)（来煜坤，面向可控视觉内容生成与编辑的深度生成模型）

发布日期：2025-09-12 浏览量：

报告题目：面向可控视觉内容生成与编辑的深度生成模型

时间：2025-9-12 11:00

地点：九教北613

主办单位：研究生工作部

承办单位：计算机科学与技术学院

报告人介绍：来煜坤（Yukun Lai），教授，英国卡迪夫大学计算机科学与信息学院，2019–2022年任学院科研主任。目前来教授担任EPSRC生成模型AI研究中心的卡迪夫方负责人，并在其中共同领导“多模态模型”工作组。来教授于2003年、2008年分别获得清华大学学士与博士学位，博士论文获“全国优秀博士学位论文”奖，已在计算机图形学、计算机视觉及相关领域的顶级会议与期刊发表论文100余篇，现任 IEEE Transactions on Visualization and Computer Graphics、Computers and Graphics及The Visual Computer等国际期刊副主编。

报告摘要：近年来，深度生成模型显著降低了视觉内容创作的门槛，用户只需提供极简输入（如一句文本提示）即可生成图像。然而，文本指令往往存在歧义，自动生成的结果时常偏离用户真实意图。虽然可以通过修改提示词重新生成，却无法保证未编辑区域完全不变，也难以实现精细控制。本次报告将介绍近期在“直观、精细可控的视觉内容生成与编辑”方面的系列工作，涵盖图像上色、三维内容生成与编辑等任务；通过引入涂鸦、草图等直观交互，让用户在保持生成质量与效率的同时，获得像素/几何级精细控制。最后，将讨论该方向仍待攻克的若干挑战。