看到腾讯一个月 1000 次, 百度是 50000/天
还有其他的吗 可以用来爬 dz 论坛吗
1
supermoonie 2020-07-07 08:59:54 +08:00 via iPhone
讯飞,网易,做云的,都有吧
|
2
supermoonie 2020-07-07 09:00:54 +08:00 via iPhone
@supermoonie 哦....验证码识别,我说的是 OCR 🤣
|
3
lihongming 2020-07-07 09:05:36 +08:00 via iPhone
百度那个准确度还可以,不过看起来你要想免费的……要是找到的话也给大家分享一下吧。
|
4
bzj 2020-07-07 09:31:48 +08:00
github 上找开源库自己搭一个
|
6
locoz 2020-07-07 11:23:43 +08:00
你要说具体是什么样的验证码别人才好给你推荐...
|
8
yujiang 2020-07-07 12:45:52 +08:00 via Android
啥验证码?图片,滑动,还是 hcaptcha 这样的
|
9
autoname OP |
10
flowercoder 2020-07-07 12:55:40 +08:00
其实用本地的效果也不错,不一定非要调 api,这东西不就是限制非人类嘛,其实可以从限制接口访问次数等其他方面去做限制
|
13
autoname OP @flowercoder 我就菜鸡一个,连百度都搜不到 相关的教程资料,很少,要么不能用,要么都是安卓的,谷歌又答非所问,搜的结果和我预期的相差很多,很少用谷歌
|
14
SingeeKing 2020-07-07 13:11:20 +08:00 1
|
15
autoname OP @SingeeKing 收到,谢谢大佬。我研究研究
|
16
flowercoder 2020-07-07 13:20:39 +08:00
@autoname 我看错了,你是要爬对吧,我刚试过 muggle_ocr,很不错,完全满足我的要求,还能调用我的 gpu,强烈推一下。昨天找的时候还试了下 ttshitu 这家收费的,测试了下也都对,一条 0.2 厘吧,感觉也能试试。tesseract 我也试了,我那种他跑不了。
|
17
autoname OP @flowercoder 对呀 爬帖子,有些帖子 隐藏回复 才能看到的, 所以。。。
|
18
chenuu 2020-07-07 13:57:56 +08:00 via Android
超级鹰
|
20
locoz 2020-07-07 15:43:36 +08:00
|
21
autoname OP @locoz 耦豁。只支持 win,阿勒,
img 参数为图片的 bytes 这是说要 base64 转码赋给 img 吗 |
22
locoz 2020-07-07 16:00:22 +08:00
@autoname #21 不需要,bytes 类型,和 base64 编码没关系。你就按 demo 里的那样直接把请求到的 content 传进去就行。
|
24
locoz 2020-07-07 18:14:28 +08:00
@autoname #23 emmmm,没有...你就按 demo 代码里面那样请求一下图片地址,然后把图片的二进制再扔给那个识别接口就好了。
|
25
autoname OP |
26
autoname OP |
27
locoz 2020-07-07 18:48:47 +08:00
@autoname #25 看了一下 okhttp3 的文档
你先请求那个验证码图片的地址,然后调用 Response.body().bytes()获取到图片的二进制。 接着,用 new Request.Builder().url("http://127.0.0.1:7788/").post(img).build();去请求识别接口。 |
29
koala9527 2020-07-07 19:31:58 +08:00
文字数字可以做字库解决的。看我的 https://zhuanlan.zhihu.com/p/146051002
|
31
autoname OP @locoz 大佬 弱弱的问下 jsoup 是这样 请求图片吗
我怎么。。 https://cdn.jsdelivr.net/gh/post-get/static/b25b023d9d184243a30867c02d952edf.png |
34
shc 2020-07-07 23:22:56 +08:00
我都用的斐斐
http://www.fateadm.com/ |
35
xuanbg 2020-07-08 08:22:38 +08:00
1 、自己搞个开源库来写代码解决
2 、淘宝打码 3 、两者结合 爬虫写得好,牢饭吃到饱。楼主千万要三思而后行啊 |
37
csavvv 2021-01-09 12:00:11 +08:00
|