V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  kakadong  ›  全部回复第 1 页 / 共 1 页
回复总数  3
2017-03-30 14:43:40 +08:00
回复了 dsg001 创建的主题 Python 用 requests 替代 scrapy 的下载器,发现速度很慢,求解
不好意思没认真看,下载了两遍是我说错的,你在 process_request 里返回了 response ,那 scrapy 就不会再去下载这个网页,但这样,并发就完全没有了,跟单线程用 requests 没什么区别
2017-03-30 14:18:29 +08:00
回复了 dsg001 创建的主题 Python 用 requests 替代 scrapy 的下载器,发现速度很慢,求解
你这是在乱搞啊,下载中间件是负责修改每个 request 和 response 的,是不做下载这个动作的!你在里面加一个 requests.get 操作,等于每个网页你都下载了两遍,而且这个 get 操作还是同步的!!
请问招爬虫工程师吗
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5308 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms · UTC 08:05 · PVG 16:05 · LAX 00:05 · JFK 03:05
Developed with CodeLauncher
♥ Do have faith in what you're doing.