近日,马栏山音视频实验室团队在CLIC2025(Challenge on Learned Image Compression)深度学习图像压缩挑战赛中荣获图像组GPU赛道全球第二名的优异成绩,团队由实验室成员邹仁杰、王得法、黄志伟组成,这一成绩标志着实验室在端到端图像压缩技术领域已达到世界领先水平。

CLIC大赛权威加持 引领全球图像压缩技术竞逐
CLIC 2025年的竞赛由Google、ETH、NYU、Microsoft、Interdigital、Amazon等顶尖机构联合组织,是端到端编解码领域影响力最大的国际赛事。本次比赛与图像编码领域历史悠久的PCS(Picture Coding Symposium)会议联合举办,进一步提升了赛事的权威性与影响力。
CLIC竞赛自2018年创办以来已成功举办八届,往届冠亚军包括清华、北大、哈工大等顶尖高校,以及商汤、阿里、华为、腾讯、字节等行业巨头。2025年的竞争尤为激烈,图像赛道有效参赛组织包括北大、武大、哈工大、首尔大学、Orange、腾讯、阿里、鹏城实验室等顶尖队伍。
此次竞赛,实验室参与竞争激烈的图像组GPU赛道中,与来自全球的顶尖高校及行业领先企业同台竞技,最终荣获全球第二名的优异成绩。


GPU赛道前四名队伍:腾讯和哈尔滨工业大学的Vcoder、马栏山音视频实验室的Evolve、武汉大学的Thanos与团队PKUSZ-AliMerlin
ST-LIC:“极简训练,极致压缩”
本次竞赛目标是在0.3bpp、0.15bpp和0.075bpp三个比特率限制下,追求最佳的主观质量。尽管赛事对复杂度没有直接要求,但规定解码由快到慢排序处于后25%队伍无法获奖,这对参赛团队的技术实现能力提出了极高要求。
我们创新的提出ST-LIC(Stable Training for Perception-Oriented Learned Image Compression),引入稳定性和有效感知优化的两个关键创新:首先,在初始训练阶段,我们分析每个损失分量的梯度贡献以确定平衡点,防止任何单个损失在更新期间占主导地位或变得忽略不计;其次,在解码器后集成一个基于UNet的细化模块,从而将失真和感知损失应用于不同的输出,实现更精确和平衡的速率-失真-感知权衡优化。

ST-LIC在纳入对抗性损失的同时,可以实现更稳定的训练,同时重建具有优越主观视觉的质量。
连获嘉奖 技术创新能力持续稳定
值得一提的是,在国际赛事舞台上实现"双线突破"的马栏山音视频实验室团队,同期再传捷报。
12月1日至4日,在奥地利克拉根福举办的IEEE国际视觉通信与图像处理会议(VCIP 2025)期间,邹仁杰、王得法、黄志伟组成的团队在第四届实用端到端图像/视频压缩挑战赛中再度斩获三等奖,充分彰显了实验室在音视频压缩领域持续稳定的技术创新能力。
此次两项国际赛事获奖,是实验室技术研发实力的集中体现,更是团队深耕音视频核心技术领域的重要成果。未来,实验室将以此次获奖为契机,持续加大在深度学习与音视频编解码领域的研发投入,推动技术成果向产业转化,为我国音视频产业高质量发展提供核心技术支撑。