对于 scrapy 中验证码怎么处理?(比如说登录知乎,现在需要验证码)
我的想法是通过 scrapy 把验证码下载下来,手动打码方式。
那么问题来了, scrapy 如何保持同一个 session 去下载验证码呢?
因为我之前用 requests 登录知乎 https://gist.github.com/Xarrow/69b971521f807924db77 ,保持一个 session ,下载验证码图片,在用这个 session 登录,可以成功。
我的想法是在 scrapy 中先用 requests 登录完,把 session 传给 scrapy 中的 cookiejar:requests.session(),
请问这样做可以么?或者有更好的方法么?
求大神给出示例~
1
iseliget 2016-01-17 02:41:00 +08:00
我要是没记错的话, Python 有个专门识别验证码的 library
|
3
sunchen 2016-01-17 11:32:42 +08:00
想省心就接入打码平台
|
4
junnplus 2016-01-17 12:31:11 +08:00 via Android
楼上的答案好像不对楼主的问题
|
6
donghouhe 2016-01-17 20:27:27 +08:00 1
用 tesseract 识别验证码过,可是姿势不对,效果不好(未试与 scrapy 搭配过)
|
8
xarrow OP 已经解决,一个字:直接上 cookies ,
不过我是先用 requests 登录,因为比较熟悉,然后再把 cookies 保持下来,传入 scrapy 的 cookies 中 |
9
mikezhang0515 2016-01-26 17:24:29 +08:00
小心爬着爬着退出了
|