新闻中心
百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名
本文开源百度网盘AI大赛文档图像阴影消除参赛方案,基于IDR网络改进:底层加Non-Local模块,提升全局信息获取能力;特征通道增至96,增强学习能力。通过添加随机阴影等数据增强提升多样性,调整损失函数使PSNR达40+。还分享了扩大卷积核等失败尝试,感谢相关支持,附各模型离线验证分数及代码相关说明。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

百度网盘AI大赛:文档图像阴影消除参赛方案开源
本项目网络源自IDR网络:Self-Supervised Image Denoising via Iterative Data Refinement
论文链接:https://arxiv.org/abs/2111.14358
github:https://github.com/zhangyi-3/IDR
项目paddle实现源自:https://aistudio.baidu.com/aistudio/projectdetail/3439099?channelType=0&channel=0
1、简介
网络与UNET极为类似,用于去除噪音、摩尔纹等
DYng进行了以下改进:
- 在底层叠加了Non-Local模块,提高网络获取全局信息的能力。
- 把网络特征通道从48增加到96,提高网络的学习能力。
2、本方案在此基础上,进行了以下工作:
1、数据增强 借鉴原论文中的思路,对数据添加干扰,提升多样性
原图:
随机阴影、随机亮度、随机伽马
擦除和随机重组
2、训练过程
训练过程中发现主要的ssim可达到99+,但psnr只有39+ 调整损失函数,原方案中损失函数为L1_loss+ssim_loss,替换为1-0.1*log10(pnsr)+ssim_loss作为损失函数。更换后,psnr达到40+。
3、大把时间踩的坑,留赠有缘人
思路1:更大的感受野,更大的卷积效果会更好,将下面三层卷积核由3调整至7
放弃原因:收敛速度变慢,模型由10M+变大到50M+,不够优雅
思路2:归一化,借鉴P2P网络,加入tanh、Instance Normalization等,加快收敛
放弃原因:图像中存在大量255值,0.5*(1+tanh)取值范围是(0,1),无法达到255,导致分数下降,Instance Normalization可能也有同样的问题,并未提高成绩
思路3:借鉴Range Scaling Global U-Net for Perceptual Image Enhancement on Mobile Devices,引入浅层特征,与最后输出层做乘运算
Motiff妙多
Motiff妙多是一款AI驱动的界面设计工具,定位为“AI时代设计工具”
334
查看详情
放弃原因:分数不升反降,留待研究突破
思路3:采用transformer编码方式重构网络
放弃原因:多次训练,pnsr无法突破30,为何分割、检测与分类都可提取到更好的信息,gan却不行,留待研究突破 模型一并开源()
4、与技术无关的总结
感谢百度举办比赛,感谢沈忱同学、朱静茹同学、秦登达同学、翟同学的支持 感谢aistudio平台DYng,FreFrankiesa开源的方案
已过而立之年,依然少年心性,任性且肆意妄为
于是被生活吊打
肺炎半年,仍未痊愈
毕业延期
家庭危机
教育责任
房贷压力
科研是一条需要独行的路,迷茫且孤独
奈何,我喜欢
要有情怀,迎难而上
要保持好奇,我们都是海边捡贝壳的孩子
要有光,我就是光
成绩复现
In [ ]!unzip data/data129115/delight_testB_dataset.zip!python submit2.py
训练过程
In [ ]# 准备训练数据与环境!unzip data/data128551/dataset_v3.zip!pip install scikit-imageIn [ ]
# 开始训练!python train.py
代码与工作简要介绍:
- IDR 离线验证最高分70.08 0和1模型是第一批数据训练,2和3是第一批+补充数据训练,作为提交模型
- MBCNN 离线验证最高分 68.64 详见:https://aistudio.baidu.com/aistudio/projectdetail/3454475?contributionType=1
- IDR-RSG(思路三)离线验证最高分68.63 详见:modules/AIDR_arch-rsg.py
- transformer网络用于任务,离线验证最高分55.92,相当于完全失败
- IDR+ (思路一,卷积大小修改为7)离线验证最高分69.78(感觉还有潜力,但训练速度慢,模型大,有大显存卡可以试试)
以上就是百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名的详细内容,更多请关注其它相关文章!
# 重构
# 罗甸网站优化推广公司
# 抖音毒舌电影的营销推广
# 大朗抖音seo团队
# 六盘水网络营销推广商家
# 油品营销的八种推广方式
# 曲靖网站建设资料推荐
# 简阳百度关键词排名
# 三河网站排名优化
# 小学生盒饭推广营销方案
# 阿里关键词其他地区排名
# 进行了
# 官网
# 更大
# python
# 开源
# 一言
# 离线
# 文档
# 百度网
# 中文网
# type
# udio
# 百度
# 百度网盘
# ai
# git
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
春运抢票技巧攻略
typescript怎么使用map
焊机上power灯闪是什么意思
linux如何使用db2命令
linux环境中如何使用ping命令
如何清理固态硬盘
单片机*计步器怎么用
平板键盘nfc功能是什么意思
命令行如何运行c
如何操作fixup命令
nosql数据库的应用场景有哪些
怎么用typescript 写js
如何编写一个linux命令
如何用好typescript
early什么意思
春运车站抢票和网上抢票
阿里云盘的会员怎么用
nfc近场通讯功能是什么意思
单片机怎么储存和显示
什么网址不能域名解析
typescript怎么写多个构造方法
如何判断固态硬盘
为什么夸克没有动漫
360f4怎么取消百变壁纸
路由器power灯一直亮是什么意思
如何由js快速切换typescript
单片机for循环怎么用
固态硬盘颗粒如何修理
折叠屏手机哪个卖得最好
皓影混动仪表盘上power是什么意思
春运车票啥时候可以抢票
5g手机4g卡怎么没有网络
单片机计时程序怎么写
手机如何运行ping命令
如何提高固态硬盘性能
点焊机接触器上power是什么意思
typescript和nodejs哪个好
wps中datediff函数怎么用 WPS中DATEDIFF函数的语法和用法分享
苹果16有哪些改善
如何用命令打开光驱
drawing是什么意思
记录仪power灯亮是什么意思
typescript是什么类型的语言
春运抢票哪里最火热
excel中datediff函数怎么用
春运抢票哪个平台好抢
put linux命令如何书写
市盈率和市净率是什么意思
广东春运几点抢票
为什么进行域名解析


2025-07-17
浏览次数:次
返回列表