新闻中心
使用纹理对比度检测检测AI生成的图像
在本篇文章中我们将介绍如何开发一个深度学习模型来检测人工智能生成的图像。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
许多用于检测人工智能生成图像的深度学习方法都根据图像生成的方式或者图像的特性/语义来确定,通常这些模型只能识别人工智能生成的特定对象,比如人、脸、汽车等。
然而,这项名为“Rich and Poor Texture Contrast: A Simple yet Effective Approach for AI-generated Image Detection”的研究提出的方法克服了这些挑战,具有更广泛的适用性。我们将深入探讨这篇研究论文,阐明它是如何有效解决了其他检测人工智能生成图像方法所面临的问题。
泛化性问题
当我们使用一个模型(比如ResNet-50)来识别人工智能生成的图像时,模型会根据图像的语义进行学习。如果我们训练一个模型来识别人工智能生成的汽车图像,使用真实图像和人工智能生成的不同汽车图像进行训练,那么该模型将只能从这些数据中获取有关汽车的信息,而对于其他物体则无法进行准确识别。
虽然可以对各种对象的数据进行训练,但这种方式耗时较长,而且仅能在未知数据上达到大约72%的准确率。尽管可以通过增加训练次数和数据量来提高准确性,但我们无法无限地获取训练数据。
也就是说目前检测模型的泛化性有很大的问题,为了解决这个问题,论文提出了以下的方法
Smash&Reconstruction
这篇论文介绍了一种独特的方法,用于防止模型在训练过程中从图像的形状中学习到人工智能生成的特征。作者提出了一种名为Smash&Reconstruction的方法来实现这一目标。
在这种方法中,图像被分成预定大小的小块,然后对它们进行重新排列,以生成新的图像。这只是一个简单的概述,因为在形成生成模型的最终输入图像之前,还需要进行额外的步骤。

将图像分割成小块后,我们将小块分成两组,一组是纹理丰富的小块,另一组是纹理较差的小块。
图像中细节丰富的区域,如物体或两个对比色区域之间的边界,就成为一个丰富的纹理块。与主要是背景的纹理区域(如天空或静止的水)相比,丰富的纹理区域在像素上有很大的变化。
计算纹理丰富的指标
首先将图像分成预先确定大小的小块,如上图所示。然后找到这些图像块的像素梯度(即找出水平方向、对角线方向和反对角线方向上的像素值之差并将它们相加),并将它们分离成丰富纹理块和纹理较差块。
与纹理较差的块相比,纹理丰富的块具有更高的像素梯度值,计算图像梯度值得公式如下:

在像素对比度的基础上对图像进行分离,得到两幅合成图像。这一过程是本文称之为“Smash&Reconstruction”的完整过程。

这样就让模型学习到得是纹理的细节,而不是物体的内容表征
fingerprint
大多数基于指纹的方法受到图像生成技术的限制,这些模型/算法只能检测由特定方法/类似方法(如扩散、GAN或其他基于CNN的图像生成方法)生成的图像。
为了精确地解决这个问题,论文已经将这些图像块划分为丰富或贫乏的纹理。然后作者又提出了一种识别人工智能生成图像指纹的新方法,这也就是论文的标题。他们提出在应用30个高通滤波器后,找到图像中丰富和贫乏纹理斑块之间的对比度。
营销型企业网站源码响应式界面1.0.1
这几年企业营销型网站成为PC端风靡一时的设计主流,主要特点就是首页长度比较长,首页展示的内容量非常大,通过对首页的大量渲染,突出企业优势、产品服务优势等众多信息,让用户在页面停留时间更久,对企业的映像更加深刻,从而达到营销的目的。但是对于大部分的营销型网站来说,一个最大的弱点就是在手机上的用户体验都比较差,而这又恰好是自适应网站所具备的优势,自适应网站能够自动检测访问者浏览设备的分辨率,从而根据访
0
查看详情
丰富和贫乏的纹理块之间的对比度有什么帮助呢?
为了更好理解,我们将图像并排比较,真实图像和人工智能生成的图像。

这两张图像使用肉眼观看也是很难查看他们的去别的对吧
论文首先使用Smash&Reconstruction 过程:


在每个图像上应用30个高通滤波器后,它们之间的对比度:


从这些结果中我们可以看到,人工智能生成的图像与真实图像的对比度相比,纹理斑块丰富和贫乏的对比度要高得多。
这样我们用肉眼就可以看到区别了,所以可以将对比度的
结果放入可训练模型,并将结果数据输入分类器,这样就是我们这篇论文的模型架构:

分类器的结构如下:

论文中提到了30个高通滤波器,这些滤波器最初是为隐写分析而引入的。
注:图片隐写的方式有很多种。广义上,只要通过某种方式将信息隐藏到图片中而难以通过普通方式发现,就可以称为图片隐写,对于隐写分析有很多相关的研究,有兴趣的可以查阅相关资料。
这里的过滤器是使用卷积方法应用于图像的矩阵值,所使用的滤波器是高通滤波器,它只允许图像的高频特征通过它。高频特征通常包括边缘、精细细节和强度或颜色的快速变化。

除(f)和(g)外,所有滤波器在重新应用于图像之前都以一定角度旋转,因此总共形成30个滤波器。这些矩阵的旋转是用仿射变换完成的,而仿射变换是用SciPy完成的。
总结
论文的结果已经达到了92%的验证精度,并且据说如果训练的更多还会有更好的结果,这是一个非常有意思的研究,我还找到了训练的代码,有兴趣的可以深入研究:
论文:https://arxiv.org/abs/2311.12397
代码:https://github.com/hridayK/Detection-of-AI-generated-images
以上就是使用纹理对比度检测检测AI生成的图像的详细内容,更多请关注其它相关文章!
# 深度学习
# 打竞猜那个网站能优化
# 眼镜店抖音推广营销公司
# 餐饮推广引流的营销方案
# 徐州seo公司选择火星
# 网站建设公司出名的
# 唐山推广全网营销联系方式
# 随州seo推广定位招聘
# 优化网站浏览速度
# 昆明广告优化招聘网站
# 较长
# 应用于
# 有兴趣
# 首页
# 这篇
# 高通
# 并将
# 提出了
# 企业网站
# 小块
# 排列
# 人工智能
# 嘉兴seo机构哪家好
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
j*a二数组怎么创建
国标控制器单片机怎么接线
单片机怎么做组合
debug中如何用n命令命名程序文件名
自己如何安装固态硬盘
j*a数组怎么存满
笔记本如何使用固态硬盘
市盈率百分位roe是什么意思
华为交换机如何复制命令行
如何选购ssd固态硬盘
苹果16系统网站有哪些
单片机怎么读取电流值
ts什么意思
固态硬盘装完如何使用
为什么有的夸克带电
开机如何进入命令行模式
如何用chown命令
animal是什么意思
如何提高固态硬盘速度
锤子手机怎么不出5g
喇叭上标的power30w是什么意思
春运抢票可以抢几次票
固态硬盘坏了如何换硬盘
电动车eco和power是什么意思
学typescript有什么用
商誉是什么意思
固态硬盘如何备份
如何安装大华固态硬盘
typescript是什么时候出来的
如何选择启用固态硬盘
为什么都做折叠屏手机呢
一天多少分钟
如何用固态硬盘做缓存
得物怎样降低手续费 得物如何降低手续费教程
win7怎么装扫描仪
vue项目如何用typescript
关系型数据库和非关系型数据库有哪些
typescript多久能学完
什么叫typescript
苹果16系统有哪些缺陷
所有删除的聊天记录都可以恢复吗?
手机如何更改固态硬盘
play的三人称单数和过去式
单片机串口接收怎么实现
j*a数组怎么新增值
如何去掉拍电脑的纹路详细教程
夸克内测有什么好处
每日推荐电声音乐软件有哪些
苹果16多有哪些功能
为什么夸克流畅播失败


2024-03-06
浏览次数:次
返回列表