所有文字应该转换成图片,然后在通讯软件里呈现。甚至是在通讯开始建立时,就打包成图片,以文字打包成图片的方式开始沟通。这种以前防采集的手段……现在应该比那些通用的对称加密算法有用。
1
ZavierXu 2019-10-11 21:07:56 +08:00 3
不,你没有……
|
2
suxiaoxiann 2019-10-11 21:08:24 +08:00 4
这让我想起当年贴吧用图片发种子。。。
|
3
richard1122 2019-10-11 21:08:27 +08:00 2
"现在应该比那些通用的对称加密算法有用"
这是为何? 把文字转换成图片最多算作一种混淆手段吧,跟加密有什么关系? |
4
heygum97 2019-10-11 21:10:19 +08:00 via Android
我曾经也有过加密通讯的想法。后来在 v2 看到了无数类似的想法和项目。
|
5
across 2019-10-11 21:10:50 +08:00
我觉得吧。你好像没理解“数据格式”和“加密”···
|
6
areless OP |
7
YamatoRyou 2019-10-11 21:15:29 +08:00 via Android
OCR 和强制接入黑箱审查制度即可让你的想法诞生即死亡.
参考微信. |
9
Jirajine 2019-10-11 21:17:42 +08:00 via Android
然后图片再经过反 OCR 处理,像图片验证码那样?
这不叫加密,不过用在国内通讯平台上也能有一定效果,但非常不可靠。 |
10
Kagari 2019-10-11 21:18:04 +08:00 1
加…密???
|
12
areless OP @YamatoRyou 不是,混淆后图形防采集,机械 OCR 是没用的。如果用 AI 是有用的,但 AI 没有那么快去识破千万条的图片信息,并且建立索引搜索关键词。
@ZavierXu 不好,人家知道你在发信息的。而我只是一个家用摄像头、行车记录仪,我也不知道怎么回事。 |
13
0TSH60F7J2rVkg8t 2019-10-11 21:22:15 +08:00 via iPhone 1
这加密很容易破啊
1. 脏点数据 管你什么图片,发来就插入人眼不可识别的脏点数据,让你解码失败或者错误。 2. 特征定位 找到加密特征,并不需要完全解密,有特征直接屏蔽。 3. 拉入黑箱 不常见的图片,经常只聊图片的人,发出即黑箱,对方不可见。 4. 封号警告 太可疑的聊天人员触发封号,每次解封都特别麻烦,搞几次就没人用你的加密工具了。 |
14
areless OP @gavindexu 我觉得军方动用不了如此算力去算每一张图。然后监控每一次访问,高频异常值的时候,就转换成 Google 的 10000*10000PX 的蒙娜丽莎给他。
|
15
niubee1 2019-10-11 21:28:25 +08:00 1
任何不走正道的方法都是异端
|
16
areless OP @ahhui 图片处理领域的算法,比那些对称加密领域要领先很多,不像对称加密算法领域,是怎么回事呢?一种是感官上接近的模糊混淆,但人类能识别。另一种是机械的精确对撞,终会有解。
|
17
dioxide 2019-10-11 21:34:10 +08:00
感觉这只是一种编码方式啊, “加密”体现在哪里?
|
18
salamanderMH 2019-10-11 21:37:02 +08:00
想法不错
|
19
bzw875 2019-10-11 21:39:39 +08:00 10
别人说计算机也有民科我不信,直到我看到 LZ
|
20
areless OP @richard1122 @dioxide 这种混淆不需要算法,这种混淆人类可识。这种混淆管理者可能识别不过来。假设我们用图形来通讯呢……我们是不是便能突破某些壁垒,现在 5G,带宽挺宽。
|
21
celeron533 2019-10-11 21:40:35 +08:00
数字水印、图像频域隐写了解下?
|
22
crella 2019-10-11 21:44:12 +08:00
经典回复:不要用技术来解决非技术问题。
|
23
linksgo2011 2019-10-11 21:44:37 +08:00 3
非常朴素的密码学观念。我在一篇博客聊过这个话题:
“在软件行业中,最有意思的是很多人对造轮子非常感兴趣(包括我),不过有一些轮子我不建议自己造。这就是加密算法,不止一个人在聊天中谈起对信息安全的看法时说,要是我开发一个自己的加密算法只有我自己的知道(甚至很多真的这么干了),肯定是天底下最安全的。这是一种非常朴素的信息安全认识,自己的创造的“加密算法”也只是根据特定规则对信息的混淆和变换,这甚至落后于凯撒密码。 现代密码学已经有大量的对称加密、非对称加密、HASH 公开算法,甚至建立了一套完整的通信信息安全基础设施( PKI ),保证信息安全的是密匙而不是加密算法。与其闭门造车,不如选择 RSA 等大师们的成果。” http://www.printf.cn/index.php/archives/software-standards.html |
24
areless OP @bzw875 民科的力量,你不懂。我常常看到有很多爱国志士用发图的方式逃避集权,我就觉得,哇……好使。比用现有函数的对称加密好使。什么私钥公钥 bip39 助记词,你倒是快速解决一下你发信息被管理层捕获到的问题啊?我想设计一款最厉害的加密(逃避监管)通讯软件。
|
25
singerll 2019-10-11 21:52:41 +08:00 via Android
图片不太好,可能会被识别,我建议转成 pdf 或者 cad
|
26
happyz90 2019-10-11 21:54:14 +08:00 via Android
不如直接用火星文?
|
28
aguesuka 2019-10-11 22:04:14 +08:00
还不如用方言
|
29
iyouth 2019-10-11 22:04:48 +08:00
还是太年轻......
|
30
FrankHB 2019-10-11 22:08:06 +08:00 1
跟监管比算力?
墙笑了…… |
31
tatsuteng 2019-10-11 22:10:47 +08:00
这...威胁模型先了解一下?
|
32
lscho 2019-10-11 22:12:17 +08:00 via Android
这不就是验证码吗。。。你知道图形验证码为啥现在都没人用了?因为现在识别图像所需算力完全没有你想的那么夸张。
而且不管你怎么混淆,肯定有一套算法,不加密的话,直接从数据层就可以得到你的数据,分分钟就解出来了,连图像识别都不用。 所以,你看,又回到了加密上。 |
33
lscho 2019-10-11 22:17:39 +08:00 via Android 1
回复完看见附言了,跟我说的一样。。“用一定算法生产的图片”,你怎么保证你这个算法不能被解开?你连加密算法都不信,你觉得自己设计的算法别人解不了?
|
34
Cytion 2019-10-11 22:22:51 +08:00 via Android
不要尝试叫醒一个装睡的人
|
35
Xs0ul 2019-10-11 22:26:16 +08:00
用图片发文字,本身就凭空增加了一个显著的特征. 只要有一个被发现,剩下的岂不是一锅端
|
36
areless OP @lscho。。。图形的优势在加密学上一直是不容易破解的。为什么现在流行 GPU 去算了呢?这款“加密”通讯软件就叫 PDV(Piero da Vinci) chat
|
37
mengzhuo 2019-10-11 22:29:17 +08:00
看着加密进来,笑着出去的
|
38
hakono 2019-10-11 22:29:29 +08:00
其实楼主你花那么大力气搞这种没卵用的,还不如开发个自动给发送到 qq 上的信息使用 aes 或者 rsa 加密成密文, 然后对方的 qq 接收到加密的数据后,对方的程序能自动读取密文并自动解密,呈现到独立窗口的软件来的现实
反正经过 aes 或者 rsa 加密的数据你不暴露秘钥,腾讯或者 zf 也没能力暴力破解你的密文 |
39
webshe11 2019-10-11 22:33:42 +08:00 23
|
40
areless OP @hakono 假设客户端程序能解。解法写在前端里,不就是此地无银三百两吗?正因为很多图形我们程序解不了,或则得花力气去解,而人能够轻易识别。
|
41
Kagari 2019-10-11 22:35:38 +08:00
很好,请问如何用图片实现前向安全性 ?
|
42
ZRS 2019-10-11 22:37:51 +08:00
看乐了
|
43
wwbfred 2019-10-11 22:38:28 +08:00 1
这个其实不算作加密.加密的目的是在已知密文的条件下无法让非密钥持有者获得明文.
你这个思路是让第三方无法意识到密文的存在,本质上是对数据的加盐. 目前没有任何已知的算法可以仅靠加盐操作通过密码强度证明. 这就意味着攻击者拿到一定数量的纯加盐数据后可以在可接受的时间内得到明文. 于是这一算法的安全性完全建立在攻击者无法意识到密文存在的基础上,一旦意识到了就完蛋了. 最后你还是要用到现有加密算法来保证数据的隐秘性和可靠性. |
45
areless OP @Kagari 滤镜库有万种图片混淆算法 随机 get,不传文字。每一个地区都向一个节点传图片,在全国几千个节点,每个节点合成 24 帧一分钟的影片,最终存入离岸服务器。然后每个节点都负责分发工作,冗余节点构架。离岸最终数据。因为图片反正都能看……载入一个变态点的滤镜库,不是传统的私钥密钥公钥结构,只是简单混淆,做到机不能解,人能解。
|
46
areless OP @lscho 并不是这样的。人八九秒处理一条复杂图形的信息,就能够通讯了。机器算作 1 秒吧。一万个人一千万条图形信息,机器要多少秒呢?现在是机器处理文字实在太快,只要不用 0.00001 秒……
|
47
hakono 2019-10-11 23:06:47 +08:00
@areless ? 你这明明是理解错了
我说的是,qq 之外单独一个程序,专门负责从 qq 的窗口中抓取聊天内容或者发送信息 然后明文的聊天内容都交给那个程序来处理,要发送信息的话,明文写到程序的输入框内(或者写到 qq 里也行,程序拦截下信息就行),然后程序将你的明文加密成密文,代你通过 qq 发送出去 对方接收到加密的密文后,解密也是同理 qq 里只发送经过加密后的密文,也就是说所有聊天内容都是无规则的加密字符串 加密解密都是独立于 qq 的,只要不泄露秘钥,腾讯和 zf 能把你的密文怎么样? |
48
hakono 2019-10-11 23:08:05 +08:00
@areless 以及这种程序其实并不难写,而且最好实现的方法是在 android 手机上,只需要一个 xposed 框架就能随意入侵 qq 的程序做任何你想做的事了
|
49
Xs0ul 2019-10-11 23:28:42 +08:00 1
@areless 你太低估机器的速度了.就看本站今天大佬分享的 repo, https://v2ex.com/t/608340, 在树梅派上跑人脸识别,一张图也就十几毫秒
|
50
mskf 2019-10-11 23:42:46 +08:00
lz 这么做的目的是为了在哪个环节防止泄密
|
51
qwx 2019-10-11 23:54:54 +08:00
我特地登上账号来回复楼主,想法不错,但是毫无用处,不如 GPG,监管要 key ?我把私钥完全销毁,你能抓我的人有什么用?打死我我都没法给你还原信息。用图片如果中途被采样怎么办,对称加密本来就不是逃避监管的好手段,隐写才是。
|
52
ilotuo 2019-10-12 00:00:56 +08:00
lz 牛逼。到时通讯软件禁止发图或者限量发图我就怪你
|
53
ilotuo 2019-10-12 00:02:56 +08:00
现在深度学习这么强大。你特征又这么明显,做个二分类网络轻松判断你的图片好吧。
|
54
areless OP @hakono 加密通讯你这个方案比我的方案好,的确只要双方加密,扔个钥给对方就可以。可是注意到没有,我这方案的应用场景,论坛或者类似微博广场的 timeline~~~能看,却不能解析的很深,屏蔽搜索引擎又屏蔽了某些大数据程序型监管。
我说成了加密,其实是不能被轻易解析又防爬虫的通用型社区软件。而没有牺牲易用性的前提下。 @Xs0ul 那是特征点比对。。。普通程序解析,就像以前 ibm 的深蓝。现在的深度学习是耗电耗时的~~~深度学习 deepai 的 api 就那么几个,训练成熟的市面上有吗?深度学习能爬这玩意,得花时间及算力。但是人脸识别就是 ocr 一样的东西,有个识别率的问题,一错全错~~~换个狗头就不认识了。 @mskf 并不是不会泄密。但是,就像只能看到大象的腿看到某几条十条百条。你在该通讯系统内是无法截获这头大象的。现在的系统大部分都能轻易被搜索,轻易截获全部。在运营商也好,在某些地方也好。通过通讯旁路也好,主动去爬取也好。 @qwx 你说的方案在加密通讯是比这个要好。但我觉得这个是有用处的。你想想有天然的易读易用性及难以整体采样分析。 |
55
ipwx 2019-10-12 00:10:47 +08:00
行了,如果官方没有盯上你,你这做法就是多此一举。
如果官方盯上了你,你这做法还是多此一举。 |
56
james2013 2019-10-12 00:17:45 +08:00
应用宝的应用上架前,如果涉及到 im,就需要到公安网站进行安全评估.并做出自我承诺,比如负责人,什么措施,聊天记录保存一定的期限.
可能是楼主想法比较幼稚,这样做意义不大. 你这个 app 出事了,小事则进行整改,比如像小红书进行应用下架处理,这个也是需要自己对违规内容进行处理,也是需要做好配合. 大问题可能都进去吃免费的饭了. |
57
areless OP |
58
AlisaDestiny 2019-10-12 00:34:15 +08:00
你朋友用你的“加密”通信软件给你发了个文章让你帮忙打印下,于是你对着图片把文章重新敲了一遍再打印。
xwsl. |
59
JJstyle 2019-10-12 00:38:37 +08:00 via iPhone
楼主重新定义了加密
|
61
delpo 2019-10-12 01:12:34 +08:00 1
@areless #55 的意思应该是,如果你开发的 app 使用人少,那并没有监管机构会盯上你
如果大范围使用了,那你 app 用的什么原理也没有意义了,直接请你去喝茶就是了 其实如果你开发这样的 app,就像#56 说的那样,无法在国内市场上架,受众必然不会很多,到最后也跟各种开源 im 一样小范围使用,就又回到第一种情况,那这种情况下为何不用 pgp 呢 |
62
Raymon111111 2019-10-12 01:19:11 +08:00
这么成熟的 ocr 是假的吗?
(百度贴吧文字发不出去的东西, 换成图片一样经常挂 |
63
asuraa 2019-10-12 01:22:54 +08:00 via iPhone
其实没那么麻烦 你不开源就行了
|
64
diferent 2019-10-12 01:27:50 +08:00 1
楼主勿怪,没有讽刺的意思,
但是看了你发的帖子和回复, 我觉得你毕业于二本或以下院校,不知道对不. |
65
jhdxr 2019-10-12 01:38:09 +08:00 1
@areless 你太低估现在 AI 的性能和功能了。纯文字型的验证码,只要你人能识别出来的,机器也就几十毫秒的事情。你人识别不出来的(说的就是 google recapcha ),机器也很有可能能猜中。所以你看现在的验证码都在往理解上面去加强(比如选择 XX 物体,点击 XX 颜色的字之类的)。
当然,如果 LZ 发现了一个混淆方法,能够在让人还能看得懂的前提下,大幅降低机器的识别成功率。我觉得钱和名都不是问题。。。 |
66
areless OP @jhdxr
真是高科技啊。的确快,新闻是这么写的只要 0.05 秒,详见此文(笑) http://www.lancaster.ac.uk/staff/wangz3/publications/ccs18.pdf @diferent 你说的都对,v2ex 从来不是什么高材生的乐园啊? 08~09 年在 V2EX 招过人,收到简历是,一个大学肄业,一个还没毕业~~~ @Raymon111111 ocr 这么厉害 |
67
mskf 2019-10-12 01:55:53 +08:00
|
68
laike9m 2019-10-12 02:02:13 +08:00 via Android
我觉得可以
|
69
jhdxr 2019-10-12 02:19:39 +08:00
@areless GAN 不是新东西了。几年前腾讯就上了,当时效果相当显著,但后来不还是逐渐换了(人都没法识别了那还要它何用)。所以你的点是?
|
70
reus 2019-10-12 05:48:30 +08:00
你倒是做出来啊。
|
71
alphatoad 2019-10-12 08:13:52 +08:00 via iPhone
密码学都有民科了啊
|
72
yogogo 2019-10-12 08:38:18 +08:00
ipv6 通讯怎么,双方交换各自的 ipv6 地址,点对点通讯就行
|
73
wupher 2019-10-12 09:07:22 +08:00
嗯,这其实算加点噪音,并不能达到你想达到的目的。
服务器如果想监管其实还是有很多办法的。统一转成黑白,再进行明暗处理后,就可以进行 OCR 识别了。 |
74
LeeSeoung 2019-10-12 09:31:01 +08:00
渣浪的图片检测会检测图片上的文字是否有敏感词。如果有会屏蔽。。end
|
75
claymore94 2019-10-12 09:31:44 +08:00
同情楼主,加密这个事情要想好,想完整,不然槽点太多。 可以看看我上一个发帖
|
76
doveyoung 2019-10-12 09:49:33 +08:00
这个,其实向 tg 学习一下不就行了?反正不给密钥。然后问题变成了密钥被泄露怎么办。如果有一种机制,能 5s10s 自动随机更新密钥,所有的节点参与维护这个机制,即使被拿到了密钥,也只能解密这段时间的内容,当然如果算法被破解了能计算出每个时间段的密钥也没啥用……说到这里,我好像想到了区块链+??哈哈哈
|
77
youxiachai 2019-10-12 09:53:53 +08:00
"一定算法生产的图片"....
最后还不是绕回到加密算法了.... 不要以为你换了一个壳我就认不得你了.... |
78
lucifer9 2019-10-12 09:59:24 +08:00
其实应用密码学这本书并不是很难读的啊
|
79
Todd_Leo 2019-10-12 11:00:23 +08:00
为什么不用端到端的 PGP 加密呢,就像邮件那样
|
80
cwbsw 2019-10-12 12:08:25 +08:00
楼主的想法真的很可笑吗?
这不就跟 VPN 不能用来科学上网一个道理吗? |
81
Vinty 2019-10-12 13:52:57 +08:00
防止 ocr 的混淆算法很有实际意义啊,希望楼主能搞出来
|
82
nnnToTnnn 2019-10-12 14:17:42 +08:00
楼主,我给个提示,在 ORC 竞赛中,已经有结论了,人眼识别,没有 ORC 准确高效。
reCAPTCHA 之前就是采用楼主的想法,去解决防止 ocr 的混淆算法,最终随着现代机器学习的发展,基本上人眼能识别出来的,机器百分之百能识别。 |
83
muyumao 2019-10-12 14:21:52 +08:00
楼主的想法从技术上看很赞,但是实用性比较差,这种聊天软件国内不会允许使用的,因为不符合监管政策
|
84
Wassermelone 2019-10-12 15:33:59 +08:00
借楼 有隐写相关工作经验的 回复我下~价格好说
|
85
Qianyu 2019-10-12 16:10:47 +08:00
|
86
Citrus 2019-10-12 16:16:47 +08:00
看了每一条回复,包括楼主的附言。楼主一直在说 机不能解人能解。机不能识别人能识别。
可是你说了这么多也没举个例子啊。。。从目前 OCR 对抗验证码的成果来看,我并不觉得你的混淆算法可以做到这点。。。 |
87
smallpython 2019-10-12 16:21:07 +08:00
不过这个想法不错, 可以设计那种阅后即焚的聊天工具
|
88
pkoukk 2019-10-12 16:34:09 +08:00
按我的理解,你想做的是,把文字转换成文字图片的形式发送对么?
那么你转换成的图片中,文字的字号、字体是否固定?如果固定的话,相对大小又是否固定? 如果以上的回答是肯定的,那么相同关键词对应的图片特征也是一致的 监管只需要对关键词所对应的图片特征进行识别即可,算力负担很小 其实目前微博已经采取特征的方式对可能裸露图片进行了识别和屏蔽,算力负担远比你想象中的更小 |
89
aqqwiyth 2019-10-12 17:18:55 +08:00
点对点没有毛病,问题是让所有人达成共识很难.....
比如自己写的 Fang 墙传输 自己用很稳. 但是大批量推广就很容易死 |
90
msg7086 2019-10-12 18:09:05 +08:00
1. 逃避监管不是加密,是混淆。加密不需要逃避监管,因为监管的人根本不知道是什么东西。你这个是监管的人肉眼一看就知道是什么东西了,你想做的是让监管的人不来关心你是否需要监管,所以本质上是一种混淆。
2. 如果两个人之间频繁互相发送图片,或者一个群里大量通过图片进行聊天,本身就会因为过于可疑而触发人工监管。 我拿爬墙举个例子,以前 VxN 特征都非常强烈,但是加密功能很强,所以是属于「监管一看就知道你在用 VxN 但是他无法破解你通讯的内容」。现在我们用丝丝,程序设计的时候就特地加强了混淆,属于「监管无法判别你到底是爬墙还是正常流量」。而墙应对的方式也很简单,对于「无法判别是爬墙还是正规流量」的,一律当成可疑流量,也就是上面我说的第 2 点。 文字转换成图片这种技术,网上冲浪都快 20 年了会没有人想出来过?为什么现在没有流行,你想过原因吗。 |
91
lzxgh621 2019-10-12 18:36:21 +08:00
新华社每次直播某人的讲话时,都是一句发一条推送。
我曾经截图试图发到微信里吐槽,然而发不出去。 |
92
areless OP |
93
jhdxr 2019-10-12 23:05:11 +08:00
@areless 别沉浸在自己的幻想里了,『生成器总能生成人眼可以识别的文字』,谷歌的文字验证码,你现在刷新几次能够正确输入一个?每次遇上都要输个好多次才能过的验证码,明显不合格。
|
94
areless OP @jhdxr 你看那文章,还没到 google 验证呢,第三个就差不多挂掉了。仔细看文章。
再给你一篇文章 https://baijiahao.baidu.com/s?id=1646884927969073605 下面两个数值 55.4%和 77.3%的准确率。你再看文字里的图像。。。 |
95
nnnToTnnn 2019-10-14 09:00:40 +08:00
@areless 最早 reCAPTCHA 就是采用楼主说的方法,进行验证干扰,然后进行人机识别。
在 2008 年的时候视觉算法已经可以根据 转二值化,然后去干扰线做到精准的识别。 例如这种验证码,但是麻烦的是需要配对应的字库 但是在 2019 年的时候,大部分都采用机器学习进行训练,也就是说指需要人进行把汉字进行分类就行了。 例如早期人工识别文字然后进行分类,自然就可以很好的识别出来内容。 你看看现在的 Google 都不往图片上面考虑了,学术界通认的事实 人眼识别 < 机器识别 |
96
wlbyg888 2021-07-29 13:05:56 +08:00 via Android
@YamatoRyou 正解,tx 的识图技术强大到离谱
|