方案有两个:方案一是打开网站->读取源代码->匹配 SRC 内的 JS 地址(但是这样做的话实际上并没有完全抓取到) 方案二打开网站->监听浏览器 network->匹配内容存在.js 的地址(因为部分网站的 JS 后面还存在一串字符 test.js457244asd24 这样)
目前的问题是浏览器 network 怎么监听呢?
1
c4f36e5766583218 2019-06-12 13:49:40 +08:00
<script ></script>
这样吗? |
2
x66 2019-06-12 17:28:03 +08:00
如果你用 selenium 来爬的话,selenium-wire 是你想要的
|
3
Jirajine 2019-06-12 17:36:25 +08:00 via Android
mitm 抓包不好吗?
|