来源:互联网 更新时间:2026-06-27 19:49
计算机视觉领域有个很有意思的新动向——传音控股TEX AI团队与上海交通大学的一项合作成果,最近被计算机视觉领域的顶会ECCV 2026接收了。ECCV和CVPR、ICCV一样,都是业内公认最有分量的国际学术会议之一,两年才开一次。今年这一届,投稿量直接奔着1万篇以上去了,最终只有2,883篇论文被接收,接收率27.5%,竞争激烈程度可见一斑。

这个成果的核心,是聚焦于智能手机影像中一个至关重要的AI能力——AI目标消除。简单说,就是帮用户快速去除照片里多余的路人、杂物、文字等,然后自动把背景补得自然、看不出来。过去基于扩散模型的编辑方案,视觉效果好归好,但问题在于推理速度太慢,手机这种讲究实时交互、低功耗的场景很难吃得消。
团队这次提出的OSOR(One-Step Object Removal)单步扩散目标消除算法框架,思路很直接:把原本需要多轮迭代去噪的复杂过程,压缩成一次前向推理。结果呢?推理速度提升了4倍到30倍不等,而且生成质量一点没打折。在1024×1024分辨率的任务中,单张A100 GPU上能实现1秒以内完成处理。这算是在“高质量生成”和“高效率应用”之间找到了一个不错的平衡点。

图示里可以看到,OSOR与现有方法的推理速度和效果对比非常直观:不仅能有效消除目标物体和它带来的阴影等视觉影响,效果还优于次优方法ObjectClear,推理加速达到了10.6倍。
说到现实应用场景,手机用户不会像专业人士那样去精细标注目标,往往就是简单涂抹、圈选一下完事。这就带来了两个挑战:一是用户输入的不精准,二是复杂拍摄环境下物体与背景之间常存在阴影、反射、倒影等视觉关联。光把目标“删掉”,背景很容易就显得突兀不自然。
针对这些痛点,团队设计了一套面向真实交互场景优化的鲁棒性AI消除方案。引入了轻量化的Alpha区域感知机制,模型能智能理解用户选中的区域和目标物体的关系,自动推断出主体以及它给周围带来的影响范围。即使你圈选区域有点偏差,模型也挺靠谱,能完成更完整、更精准的目标移除,然后把背景恢复得自然一致。为了支撑这个能力,团队还构建了一个包含28万组高质量目标消除样本的数据集,从数据源头保证了模型的学习效果。

通过这些技术,AI消除已经从单纯的“删除目标”升级成了基于场景理解的“智能重建”。用户操作门槛降低不少,照片编辑出来的效果也更自然真实。
这次入选ECCV 2026,算是传音在计算机视觉领域的又一个标志性成果。他们长期在视觉智能、生成式AI、多模态交互这些前沿方向上持续投入,同时也比较注重把这些技术转化成真实可用的终端产品体验,形成从研究、研发到产品的完整链条。未来,图库AI消除和智能助手AI修图功能会在传音手机上率先落地,结合多模态理解能力,让照片编辑更智能化、更自动化。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
archiveofourown 实战指南:常见用法整理
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
作家助手如何上传自制封面 作家助手如何设置小说的封面
如何在夸克浏览器中开启网页视频的倍速播放功能?
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
电视剧《小欢喜》剧情介绍
全链网:黄金价格因美元的走强及利率担忧而下跌
美国市场:股票相对债券的风险溢价正在消失
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
有寓意的易经网名男生(精选100个)
电影《遁甲门之消失的公主》剧情介绍
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
植物娘大战僵尸电脑端与手机端存档转移的方法
动漫《柚木家的四兄弟》剧情介绍
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
卡厄思梦境哀嚎螺旋塔攻略 哀嚎螺旋塔怎么玩
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc