这个网站一个账号查询的次数是不是有限制啊? 限制多少次?
是不是需要买 vip 账号爬?
1
d5 2019-01-20 21:56:36 +08:00 via iPhone
做爬虫出生的公司,你要爬,阻力太多了
|
2
zwl2012 2019-01-20 21:57:40 +08:00 via iPhone
接口加密了 密钥有效期 1 分钟
|
3
faustina2018 2019-01-20 21:58:06 +08:00 via iPhone
想多了。老老实实买接口吧,卖数据接口的网站会让你爬?
|
4
tomxin7 2019-01-20 22:00:28 +08:00
去年爬过,但是没有批量,cookie 过期好像时间还挺久的,可能我爬的比较少吧
|
5
519718366 2019-01-20 22:57:12 +08:00 via iPhone
我这是找他们商务合作的
|
6
guog 2019-01-20 23:03:52 +08:00 via Android
他们的数据也是从郭嘉企业信息网爬的吧,不如直接从源头入手
|
7
locoz 2019-01-20 23:15:24 +08:00 via Android
只需要简单的信息就行可以直接爬工商局
|
9
lhx2008 2019-01-20 23:30:23 +08:00
反爬虫很厉害的,无所不用其极,验证码也很难,爬几百个没问题,多了代理池都爬不下来。
天眼查最开始应该是自己爬的,后面为了数据合法找了个背景做靠山。 |
10
OctopusGO 2019-01-21 00:15:42 +08:00 via Android
是需要买 vip,我公司现在是用 Java 爬的
|
11
scriptB0y 2019-01-21 00:50:04 +08:00
... 你去爬一个爬虫网站
|
12
xiaotuzi 2019-01-21 01:33:27 +08:00 via iPhone
小心给你一个律师函
|
13
izoabr 2019-01-21 01:38:11 +08:00
要不考虑一下行政渠道的爬虫?
|
14
jssyxzy 2019-01-21 06:13:01 +08:00
以前爬过,应该可爬,可能需要上 phatomjs
|
15
myhot21 2019-01-21 08:44:41 +08:00 via Android
自从要登录注册后,就基本不能爬了,给钱买数据吧。
|
16
supervipcard 2019-01-21 08:50:40 +08:00
如果已经有一个大的公司名列表,逐个搜索爬不难,把代理、cookie 池、验证码识别都弄上。
|
17
fenghuang 2019-01-21 09:02:57 +08:00
极验证就不好弄
|
20
Ewig OP @supervipcard 主要怕限制账号次数啊
|
22
passerbytiny 2019-01-21 09:27:38 +08:00
总感觉爬数据这事,大公司做是废物利用地商业行为,个人爬就是抢数据地流氓行为:我脑袋到底哪里出问题了。
|
23
Ewig OP @supervipcard 关键很多说买 vip 爬不知道为啥
|
24
supervipcard 2019-01-21 10:08:18 +08:00
@Ewig 可能是因为单次搜索的页数限制吧
|
26
guanhui07 2019-01-21 11:19:49 +08:00
他爬别人,你爬他,别人爬你
|
27
kevinle 2019-01-21 11:21:53 +08:00 via Android
脱裤更省事
|
28
blueskea 2019-01-21 12:10:11 +08:00 via Android
爬过企查查,字体被替换过了,验证码搞不定,半自动爬的。
|
29
dezhou9 2019-01-21 13:50:16 +08:00 via Android
1.8 亿条你爬他干嘛
|
31
Ewig OP @supervipcard 比如我每次搜百度 腾讯 这种公司能搜多少次,普通的账号
|
32
wisej 2019-01-21 16:36:17 +08:00 via Android
|
33
uuair 2019-01-21 17:03:30 +08:00
有这功夫,你不如应聘进去,内网直接往外倒腾。
|
34
loser 2019-01-21 17:18:03 +08:00
牛逼,支持爬他!!!
|
36
love9918 2019-01-21 19:10:33 +08:00
有想法就干
|
37
hgjhgjgjhgjg 2019-01-21 19:28:12 +08:00
https://www.lagou.com/jobs/1570819.html
反爬虫工程师 职位描述 参与公司网站数据反爬虫策略的制定和优化。 负责反爬虫功能模块的代码实现及测试工作。 监控网站异常访问并及时调整相关策略。 |
38
andylsr 2019-01-21 19:49:03 +08:00 via Android
天眼查数据随便抓。。。
|
39
zhangsen1992 2019-01-21 20:14:42 +08:00
vip ip 白名单 随便调用接口
|
41
kzfile 2019-01-21 20:59:20 +08:00
爬一会整个网页开始部分字乱序,后面乱序的会越来越多
|