项目名称:weibot
详细文章: https://learnku.com/articles/36980
项目地址: https://github.com/hanson/weibot
preg_match_all('/Pl_Official_MyProfileFeed__20.*html\":\"(.*)\"}/', $html, $matches);
基于 weibot,开发微博的抓包工作会更加简单
微博很多操作都需要登录,所以写脚本的时候先登录,让 cookie 存储起来 $weibo->login()
根据浏览器看到的请求,我们可以尝试模拟一下
<?php
include_once __DIR__.'/../vendor/autoload.php';
$weibo = new \Hanson\Weibot\Weibot([
'username' => '',
'password' => '',
'cookie_path' => __DIR__.'/cookie', // cookie 存储路径
'debug' => []
]);
// $client 已经是一个带 cookie 的“浏览器”客户端了,根据实际情况进行 get 或者 post
$client = \Hanson\Weibot\Api\Api::getClient();
$response = $client->post('http://weibo.com', [
'header' => [
// 如果有特殊 header 需求
],
'form_params' => [
// 各种请求参数
]
]);
// 得到的 response 有可能是页面,也有可能是接口,自行处理
$data = json_decode($response->getBody()->getContents(), true);
分享个交流群
1
hhhfffhhh 2019-11-22 11:29:56 +08:00 via iPhone
看不到交流群的图
|
2
HanSonJ OP @hhhfffhhh #1 这是微博的图床哦,如果看不到可以去文章里面看看,也有 https://learnku.com/articles/36980
|
3
abinnz 2019-11-22 13:00:05 +08:00 via iPhone
之前爬过微博,可以直接爬微博手机端的 api,爬的频率太快也是会触发反爬
|
5
wujunze 2019-11-22 13:45:55 +08:00 via iPhone
🐮🍺
|
6
Lunatic1 2019-11-22 14:55:57 +08:00
上个月刚好接了一个爬微博的项目,扒的手机端的接口。微博反爬做的还可以,就算登录还是会有几率识别为爬虫。
因为手上可用 IP 少所以速度不敢太快....被封就 15 分钟的小黑屋是真的烦.... |
10
dosmlp 2019-11-22 18:19:51 +08:00
直接逆向 Android 客户端拿 api 爬不香么,分得去搞 web
|
11
qbhy 2019-11-23 10:26:00 +08:00
666
|