来源:互联网 更新时间:2025-07-17 11:31
本文开源百度网盘AI大赛文档图像阴影消除参赛方案,基于IDR网络改进:底层加Non-Local模块,提升全局信息获取能力;特征通道增至96,增强学习能力。通过添加随机阴影等数据增强提升多样性,调整损失函数使PSNR达40+。还分享了扩大卷积核等失败尝试,感谢相关支持,附各模型离线验证分数及代码相关说明。
本项目网络源自IDR网络:Self-Supervised Image Denoising via Iterative Data Refinement
论文链接:https://arxiv.org/abs/2111.14358
github:https://github.com/zhangyi-3/IDR
项目paddle实现源自:https://aistudio.baidu.com/aistudio/projectdetail/3439099?channelType=0&channel=0
网络与UNET极为类似,用于去除噪音、摩尔纹等
DYng进行了以下改进:
1、数据增强 借鉴原论文中的思路,对数据添加干扰,提升多样性
原图:
随机阴影、随机亮度、随机伽马
擦除和随机重组
2、训练过程
训练过程中发现主要的ssim可达到99+,但psnr只有39+ 调整损失函数,原方案中损失函数为L1_loss+ssim_loss,替换为1-0.1*log10(pnsr)+ssim_loss作为损失函数。更换后,psnr达到40+。
思路1:更大的感受野,更大的卷积效果会更好,将下面三层卷积核由3调整至7
放弃原因:收敛速度变慢,模型由10M+变大到50M+,不够优雅
思路2:归一化,借鉴P2P网络,加入tanh、Instance Normalization等,加快收敛
放弃原因:图像中存在大量255值,0.5*(1+tanh)取值范围是(0,1),无法达到255,导致分数下降,Instance Normalization可能也有同样的问题,并未提高成绩
思路3:借鉴Range Scaling Global U-Net for Perceptual Image Enhancement on Mobile Devices,引入浅层特征,与最后输出层做乘运算
放弃原因:分数不升反降,留待研究突破
思路3:采用transformer编码方式重构网络
放弃原因:多次训练,pnsr无法突破30,为何分割、检测与分类都可提取到更好的信息,gan却不行,留待研究突破 模型一并开源()
感谢百度举办比赛,感谢沈忱同学、朱静茹同学、秦登达同学、翟同学的支持 感谢aistudio平台DYng,FreFrankiesa开源的方案
已过而立之年,依然少年心性,任性且肆意妄为
于是被生活吊打
肺炎半年,仍未痊愈
毕业延期
家庭危机
教育责任
房贷压力
科研是一条需要独行的路,迷茫且孤独
奈何,我喜欢
要有情怀,迎难而上
要保持好奇,我们都是海边捡贝壳的孩子
要有光,我就是光
!unzip data/data129115/delight_testB_dataset.zip!python submit2.py登录后复制
# 准备训练数据与环境!unzip data/data128551/dataset_v3.zip!pip install scikit-image登录后复制 In [ ]
# 开始训练!python train.py登录后复制
悟空浏览器网页版:免费畅游网络世界的极速入口
豆包AI安装需要哪些运行时库 豆包AI系统依赖项完整清单
2025迷你世界雨薇免费激活码
2025崩坏星穹铁道7月3日兑换码
Perplexity AI比Google好吗 与传统搜索引擎对比
ChatGPT如何生成产品原型 ChatGPT产品设计辅助功能
哔哩哔哩教程哪里找
光遇6.19大蜡烛在哪里
《怪物乐土》哥布林猎手光暗选择技能加点
小米在全球范围推送澎湃OS 2.2 这几款机型现可升级
iPhone15pro怎么拍动态照片?
2025原神7月2日兑换码分享
如何轻松在iPhone上安装DeepSeek
光遇7.8免费魔法是什么
蚂蚁庄园今日最新答案7.10
剪映人像虚化怎么使用 剪映人像虚化使用方法
iPhone15 Pro Max屏幕一直亮着是什么原因
Edge浏览器怎么关闭某个进程
qq音乐怎么免费听歌?qq音乐免费听歌教程
铁路12306怎么改签?铁路12306改签教程
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc