新闻中心

打码就安全了?像素化(马赛克)破解技术Depix简介

2025-07-29
浏览次数:
返回列表
本文介绍了能破解文本马赛克的Depix项目。其基于线性方框滤波器原理,利用德布鲁因序列生成查找图像,通过匹配像素化区块还原文本,非AI生成式恢复。该项目有字体等限制,用法简单,可结合OCR实现自动化,前人曾用穷举法,作者批判了GAN的生成式恢复。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

打码就安全了?像素化(马赛克)破解技术depix简介 -

序言

像素化(马赛克)是一种常见的打码方式,通过降低图像中部分区域的分辨率来隐藏某些关键信息。不过,道高一尺魔高一丈啊……

比如本文介绍了的这个相当有意思的破解马赛克项目Depix,Github上线三天近7000 star,目前,已接近15000 star。

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

毕竟这个效果看起来相当好了,如果自制数据集配合PaddleOCR识别,恐怕连识别部分都不需要人工干预了

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

接下来,我们就试着研究下这个项目。

参考资料

  • 原文介绍:Recovering passwords from pixelized screenshots
  • Depix项目地址
  • De Bruijn Sequence Generator for Faster Shift Register Code Bruteforcing
  • 打马赛克就安全了吗?AI消除马赛克,GitHub开源项目上线三天收获近7000星

像素化(马赛克)是什么

首先,作者介绍了马赛克的原理。作者说道,他要破解的目标是使用普通线性滤波器的像素化结果。我们不妨认为下面这个表情包可以分割成四个大小相同的方块,那么,通过线性滤波器每个方块会得到一个计算结果,再用这个结果填充该方块内输出图像上每个像素点的值。所以,我们会看到,这个笑脸完全在输出结果中完全被隐藏了,这就是马赛克最简单的实现方式之一。

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

一些消除马赛克的尝试

Depix并不是凭空产生的,前人的工作成果给了作者很大的启发。如果在缺少可以还原图像的已知信息,过往的研究方案无一例外地选择了看似最“笨”的办法:如果我要破解某个信用卡号,那就对所有信用卡号它们进行像素化,然后将恢复结果与被像素化的卡号进行比较。我们可以理解这类匹配的方式,类似于穷举。

熟悉GAN技术的读者可能知道,理论上我们可以通过GAN在某种程度上实现马赛克“消除”。但是,用AI技术的话,恢复的马赛克区域本质上是生成的,并不是真正的原始结果。本文中,作者对此也批判了一番:The AI generates faces that result in the same image when pixelized, but the face it recovers is not the original.

算法介绍

首先明确研究的场景还是有限制的,这是基于文本的马赛克恢复研究。

由于线性方框滤波器是一种确定性算法,对同样的值执行像素化通常会产生同样的像素化 block。使用同样位置的 block 对相同文本执行像素化,会得到同样的 block 值。我们可以尝试像素化文本来找出匹配的模式。更幸运的是,我们还可以把每个block或block组合看作一个子问题。

Motiff妙多 Motiff妙多

Motiff妙多是一款AI驱动的界面设计工具,定位为“AI时代设计工具”

Motiff妙多 334 查看详情 Motiff妙多

项目的局限:作者没有选择创建潜在字体的查找表。该算法要求在相同背景上具备相同的文本大小和颜色。

最终解决方案:使用待处理字符的 De Bruijn sequence (德布鲁因序列),将其粘贴到相同的编辑器中,然后截图。该截图可以用作相似 block 的查找图像。

问题:什么是De Bruijn sequence?到这个网站试试看就知道啦。De Bruijn Sequence Generator for Faster Shift Register Code Bruteforcing

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

德布鲁因序列包括待处理字符的所有双字符组合。这很重要,因为一些block会重叠两个字符。找出恰当的匹配需要搜索图像中具备相同像素配置的block——换句话说,穷举地更完善了,这样将像素化的block与匹配block对照的时候,匹配上的概率更高。双字符德布鲁因序列:

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

在以下测试图像中,Depix 算法无法找到「o」的一部分。这是因为在搜索图像中,搜索 block 还包含下一个字母(「d」)的一部分,但在原始图像中这里有个空格。——换言之,这个算法有个比较大的缺点,那就是对“匹配”要求比较苛刻

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

算法实验

该项目用法相当简单,一行命令搞定:

python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png
    In [3]
# !git clone https://github.com/beurtschipper/Depix
       
Cloning into 'Depix'...
remote: Enumerating objects: 89, done.
remote: Total 89 (delta 0), reused 0 (delta 0), pack-reused 89
Unpacking objects: 100% (89/89), done.
Checking connectivity... done.
        In [1]
%cd Depix/
       
/home/aistudio/Depix
        In [ ]
!python depix.py -p images/testimages/testimage3_pixels.png -s images/searchimages/debruinseq_notepad_Windows10_closeAndSpaced.png -o output.png
   

移除马赛克效果

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

制作自己的解密系统

掌握了Depix,我们也可以根据算法的要求准备自己的德布鲁因序列与带测试马赛克截图。一个关键点是,字体大小一致。这个简单操作实际做起来还有一丢丢麻烦。

In [6]
!python depix.py -p images/testimages/21.png -s images/searchimages/03.png -o output3.png
       
INFO:root:Loading pixelated image from images/testimages/21.png
INFO:root:Loading search image from images/searchimages/03.png
INFO:root:Finding color rectangles from pixelated space
INFO:root:Found 62 same color rectangles
INFO:root:45 rectangles left after moot filter
INFO:root:Found 11 different rectangle sizes
INFO:root:Finding matches in search image
INFO:root:Removing blocks with no matches
INFO:root:Splitting single matches and multiple matches
INFO:root:[2 straight matches | 38 multiple matches]
INFO:root:Trying geometrical matches on single-match squares
INFO:root:[4 straight matches | 36 multiple matches]
INFO:root:Trying another pass on geometrical matches
INFO:root:[4 straight matches | 36 multiple matches]
INFO:root:Writing single match results to output
INFO:root:Writing *erage results for multiple matches to output
INFO:root:S*ing output image to: output3.png
       

这里用某知名聊天软件的截图马赛克功能做了个尝试,手法比较粗糙,把上下左右行的字符给混进来了,导致效果不太好,不过,也许火眼金睛的读者能猜出加密的什么。哈哈。

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

打码就安全了?像素化(马赛克)破解技术Depix简介 -        

以上就是打码就安全了?像素化(马赛克)破解技术Depix简介的详细内容,更多请关注其它相关文章!


# git  # 云南seo排名方案公司  # 东莞网站建设排名靠前  # 网站???优化?件  # 全年营销推广计划  # 乐器市场营销推广方案  # 折扣店营销推广文案  # 我们可以  # 有个  # 是一种  # 卡号  # 自己的  # 一言  # 布鲁  # 穷举  # 打码  # 中文网  # udio  # notepad  # 聊天软件  # ai  # windows  # python  # 广告营销推广费用多少  # 阳泉关键词排名方法优化  # 邯郸seo亅驰捷网络  # 平顶山网络营销推广软件 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 数组和J*A怎么打  干股是什么意思  华硕k20ce怎么装win7  手机如何运行ping命令  电信开通nfc功能是什么意思  typescript如何做项目  春运抢票可以抢几张  在遥控器中power是什么意思  一天多少分钟  红米手机怎么设置变成5G手机  单片机是怎么复位的  商誉是什么意思  ip dhcp是什么意思  sausage是什么意思  课程伴侣登不上怎么办  满射为什么没有逆映射  联想的固态硬盘如何  苹果16日发售哪些机型  春运抢票需要什么软件抢  如何检测固态硬盘温度  折叠屏手机为什么这么小  命令行如何打开文件  8800日元等于多少人民币  sql isnull函数如何使用  春运抢票可以抢几次啊  vfp 命令窗口如何实现换行  ai文件里无法找到链接文件怎么解决  如何查看邮件域名解析  电动车power灯亮红灯是什么意思  雅迪电动车上的power是什么意思  固态硬盘如何外接  苹果怎么没出5g手机  vue中datediff函数怎么用  苹果16有哪些系统  为什么都做折叠屏手机呢  typescript是什么软件  如何以命令符运行程序  j*a怎么求数组均值  nfc近场通讯功能是什么意思  夸克学习都有什么课程  为什么夸克运行不了  今天是农历多少号  typescript要用什么工具  花呗征信不好如何恢复 如何修复不良的花呗征信  固态硬盘如何迁移系统  春运抢票极速版怎么抢票  vi命令如何退出编辑模式  迅达热水器显示power是什么意思  typescript接口怎么选  抖音GMV是什么_抖音GMV是什么意思 

搜索