淘宝的生意参谋,这种平台为啥有全网各平台的数据,甚至还可以看竞争对手的数据。。。 我用 rpa 试过模拟人的操作去获取,效率低不说还经常会被封号。它们这种平台是如何做到不会被封号,还能实时更新最新数据,这是怎么做到的?
1
ZnductR0MjHvjRQ3 261 天前
你难道就没想过 有 openAPI 吗?
|
2
securityCoding 261 天前
买的数据
|
3
ZSeptember 261 天前
应该是互相爬的吧。
前段时间还有新闻,京东的爬虫被 pdd 屏蔽了。https://36kr.com/p/2610860492414852 |
4
ZSeptember 261 天前
爬虫是有技术的,淘宝的听说就挺难搞的。
|
6
yurman OP @ZSeptember 淘宝是很麻烦,已经是低量数据爬取,完全模拟人为操作。偶尔还是能触发警告
|
7
BeiChuanAlex 261 天前
很简单,买数据,给钱就能办到。你陷入到了技术的思维漩涡,线下花钱可以办到线上花大力气都办不到的事情。
|
8
yurman OP @BeiChuanAlex 我是觉得是没有啥技术能做到,可惜我只是个打工仔,老板不信 :(
|
9
wanniwa 261 天前
有的公司是专门成立爬虫组,立项去攻克研究的。投入成本就会有收获。一步步去拆解剖析
|
10
DT27 261 天前
淘宝我真人去访问都费劲,动不动就弹验证,还经常验证失败。。。
|
11
yahooer 261 天前
也有第三方接口供应商 像淘宝的比如这个 www.idatariver.com/zh-cn/projects
|
12
lilei2023 261 天前
淘宝这个真人访问,都经常弹,被人机器了,真恶心,
|
13
angryfish 261 天前
商业级爬,是需要资源的。
你有多少个独立的 ip 地址?你有多少个用户号? 曾经在某旅游网站做个爬友商相关的项目,光买 ip 资源就用了三百万,还不包含自己机房的 ip 该花的钱还是得花。 |
14
corcre 261 天前
淘宝的反爬做的挺好的(甚至能防正常用户), 目前说到低成本爬淘宝数据站立的老哥一个个都是摇头
|
15
Blanke 261 天前
有商业的成熟方案,很多数据公司内部都是全网怕,tb jd pdd 这些都是基操了,只要花得起升本,肯定能搞定
|
18
sergio948 261 天前
我最近看豆瓣的反爬也是挺 6 的,第一次遇到,看抓包情况好像是做了加密,反正没看懂
|
20
hackerfans 261 天前
淘客有 API
|