上次请教了大家关于平胸妹子鉴黄的问题,调整了一下训练数据集之后又练了个模型 120.78.173.99:4000/tryout 这里可以体验一下,手机端和 PC 端访问都做了适配,后续等我把代码整理一下就丢 gayhub 上了(由于是二手 py,所以会比较丑)
同时收一波训练素材:doge
1
tinytin 2018-01-24 14:19:13 +08:00
我是素材
|
2
sennes 2018-01-24 14:51:44 +08:00 1
刚刚试了 4 张图 分别检测的话
NSFW 0.004 0.004 0.118 0.003 但是拼成一张图之后 NSFW 0.890 |
3
f2f2f 2018-01-24 15:02:10 +08:00
1#头像 0.4114783704280853
|
4
northisland 2018-01-24 15:05:49 +08:00
Something is not right.
Error: Internal Server Error The server encountered an internal error and was unable to complete your request. Either the server is overloaded or there is an error in the application. |
5
tghgffdgd 2018-01-24 15:08:56 +08:00 1
这个时候是不是应该来个“已屏蔽”
|
6
xwhxbg OP |
8
Weny 2018-01-24 15:13:51 +08:00 via iPhone
当然是去草榴抓
|
10
Willjim 2018-01-24 15:38:52 +08:00 via Android
楼主,放的几个健身男的图,似乎有 0.5?要不要加胡须识别?而且网站 icon 是守望?🤔
|
11
xwhxbg OP @Willjim 其实 0.3-0.7 之前都属于 sexy 的范畴,实际运用的时候我把这些图标记黄图,但是需要人工审核,至于产品去不去审核那就......
|
13
Willjim 2018-01-24 15:51:49 +08:00 via Android
@xwhxbg 刚刚有张网上找的健身自拍图,高达 0.84😅而且 0.3-0.7 范围太广了吧,产品会审怕是难。
|
14
taurenshaman 2018-01-24 15:53:30 +08:00 5
这张图的 SFW 还不到 0.1
https://i.loli.net/2018/01/24/5a683b43a253b.jpg ![SavedPicture(2) 4.jpg]( https://i.loli.net/2018/01/24/5a683b43a253b.jpg) |
15
taurenshaman 2018-01-24 15:54:51 +08:00
呃,是 NSFW 值
|
16
xwhxbg OP @taurenshaman emmm 这个明显是 bug,不确定是不是因为我的素材里没有单纯的身体局部导致的
|
18
onionnews 2018-01-24 16:14:56 +08:00 via Android
已经开始飙车了
|
19
keithszc 2018-01-24 16:16:24 +08:00
可怕
|
21
Weny 2018-01-24 16:20:43 +08:00 via iPhone
@taurenshaman 真的怕
|
22
kenshinhu 2018-01-24 16:23:44 +08:00
服务器好像不能访问了?
|
23
gamexg 2018-01-24 16:26:44 +08:00
没填 url 就点了提交,然后就打不开了...
|
24
xwhxbg OP |
25
skyrem 2018-01-24 16:31:35 +08:00
google 搜 GAY 然后贴上的基本都 NSFW
|
26
zo 2018-01-24 16:37:36 +08:00
这就直接开车了。。。
|
27
zst 2018-01-24 16:39:52 +08:00 via Android
其实我想说有些我自己都不知道算不算小黄图
|
28
mcone 2018-01-24 16:42:17 +08:00
啊 看到楼主头像我就想到你之前那个剑皇帖子了 果然还是你哈哈 随手找了几个关键词搜了十几张图丢了上去 感觉比我想象的好不少……哈哈
话说这个结果不太像是用 3k 样本训练出来的。。。能大概透露下训练样本数和方法吗,直接用已训练好的模型,finetune 一下?难道是直接训练出来的吗(惊恐) 不过有一些 NSFW 本身就涵盖过的图片类别在你这里反而结果有点奇怪 感觉你应该微调了啥…… |
29
xwhxbg OP @mcone 确实只有 3K,用的 nn.softmax,数据处理参考的 open-nsfw,它有个方法用来处理数据矩阵的,然而由于我数学渣渣,看不懂为啥要这么做,目前感觉可能是样本太少导致很多图的结果很奇怪,多人图,身体局部图都很奇怪
|
30
kingcc 2018-01-24 16:53:47 +08:00
火钳刘明
|
31
jarnanchen 2018-01-24 17:07:56 +08:00
给楼主 贡献了几张大胸肌肉男,NSFW 0.48 算不算黄啊
|
32
Travers 2018-01-24 17:15:14 +08:00
传了个 22600082070.jpg ,才 0.09 ,楼主可以看下
|
33
Travers 2018-01-24 17:17:35 +08:00
还有个 22600082078.jpg NSFW 0.078 问题比较大
|
34
R18 2018-01-24 17:17:37 +08:00 via Android
老哥有源码了求艾特
|
35
mcone 2018-01-24 17:24:50 +08:00
@xwhxbg 完全自己训练的吗……那这个结果其实已经不错了 才 3k 数据量要啥自行车(哈哈哈哈) 不过通常 nn.softmax 用于多类 你的样本太少了 有空的话可以改 sigmod 试试看
那个处理数据矩阵的方法我不太清楚,回头等你开源了我围观下吧,毕竟不是做黄图的对这块还真是不太了解…… 至于我上条回复提到的类别的是 athlete,可能你的训练样本里不够多,很多露肉运动员被搞成了黄图……但是我不确定直接加一些类似样本会不会有帮助,因为你数据太少了,加的多了反而可能对你模型有负效果…… |
36
xwhxbg OP @mcone Will do,现在主要是我没有理论支撑,单纯靠调参或者调方法可能不能达到一个可行的高度,而且 py 的性能问题也很突出,目前想要把训练好的模型用 golang 的 TensorFlow binding 来调用,不知道会不会有明显的区别
athlete 这个问题其实蛮严重的,我看了下我收到的结果波动很大,有些 NSFW 被打的很高,有些很低,跟我预想的能节约 90%以上的人力成本差的很有点远,目前看来能节约 50%就不错了 目前在看 https://www.coursera.org/learn/machine-learning 这个课程想要补一下入门知识,现在只恨时间太少,白天还要搬砖,搞完不知猴年马月了 |
38
gh110827 2018-01-24 17:36:53 +08:00
楼主,我这有个接口,大概是 6000 多张图,都是煎蛋上的,你可已用来当素材训练
https://ie34.com/api/jiandan |
39
AckywOw 2018-01-24 17:58:56 +08:00
老司机带带偶🤓
|
40
owlsec 2018-01-24 18:11:48 +08:00
流弊
|
41
Level5 2018-01-24 19:08:10 +08:00
开源不? 作为遵从人本性出发,LZ 应该贡献源代码让我们反其道而行....😂
|
42
imn1 2018-01-24 19:24:18 +08:00
自己去找力武靖的图吧,不过我没有,收这些图有风险,也没这样的嗜好
不是平凶的倒很多 |
44
zonghua 2018-01-24 20:09:47 +08:00 via iPhone
@taurenshaman 地铁上我点开了这个图。。。z
|
45
sobigfish 2018-01-24 20:10:20 +08:00
@gh110827 #38 的煎蛋里的图 006rN2x6gy1fibr74qjnnj30ks0rr75r 这个 0.26040464639663696 emmmmmm
|
46
AlisaDestiny 2018-01-24 22:24:43 +08:00
百度随便找了个图:
http://g.hiphotos.baidu.com/image/pic/item/c8ea15ce36d3d539f09733493187e950342ab095.jpg NSFW 0.21911317110061646 SFW 0.7808868288993835 |
49
baskice 2018-01-25 06:20:13 +08:00
感觉效果还可以,至少比新浪微博的判断准确率高
|
50
glchaos 2018-01-25 08:47:54 +08:00
老衲差点圆寂在你们的回复中
|
51
opengps 2018-01-25 09:14:21 +08:00
题主收集 H 图的能力非常的可以
|
52
cat9life 2018-01-25 09:17:25 +08:00
这空手套图术果然 6
|
53
Felldeadbird 2018-01-25 09:21:32 +08:00
@mingyun 哇~一大早上班就看到这个。我是 AI 估计受不了了。
|
54
lingyv 2018-01-25 09:29:10 +08:00
不错,用的啥模型?
|
55
xwhxbg OP |
56
xiaojunjor 2018-01-25 09:39:59 +08:00
别关门,别关门,我上错车了。。我先下去
|
57
gh110827 2018-01-25 10:27:23 +08:00
|
59
gh110827 2018-01-25 10:29:22 +08:00
我的那个接口是从数据库随机返回一个图片,准备做个应用,可以无限看图的,太懒还没写
|
63
charexcalibur 2018-01-25 11:27:58 +08:00
我也要学机器学习!
|
64
mikeven 2018-01-25 11:46:23 +08:00 via iPhone
reddit nsfw
|
66
Zzde 2018-01-25 21:36:20 +08:00
试了几张 大部分都是 NFW
|
67
Zzde 2018-01-25 21:42:53 +08:00
??? |
69
laodao1990 2018-01-29 20:44:36 +08:00 via iPhone
教练,我想学开车
|