首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
zhurongx
›
全部回复第 1 页 / 共 1 页
回复总数
2
2014-05-08 11:48:02 +08:00
回复了
lightforce
创建的主题
›
问与答
›
面对采集器,有什么好方法防止或者屏蔽采集的吗?
90%的情况下有效的方法:
把速度快,频率高,已经超出人类操作的频率的来源ip进行限制。监控ip访问流量、次数等特性的工具有很多。
剩余10%基本无解的方法:
好的爬虫会有一个ip池,会把请求分散在大量ip服务中转发,隐藏自己速度快频率高的特点,伪装成正常请求。这种情况下,除非你使用限制性逻辑,如积分满多少才可以打开,否则是无解的。
2014-05-05 15:56:59 +08:00
回复了
hyspace
创建的主题
›
分享创造
›
Gitblog.io - 简洁的 Github Pages 博客编辑器
卡在Checking if new repo is ready...了
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
5078 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms ·
UTC 05:39
·
PVG 13:39
·
LAX 21:39
·
JFK 00:39
Developed with
CodeLauncher
♥ Do have faith in what you're doing.