V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  liubaobei199209  ›  全部回复第 1 页 / 共 1 页
回复总数  4
2015-12-10 20:25:02 +08:00
回复了 liubaobei199209 创建的主题 问与答 有没有人爬虫过 APP???求赐教
2015-12-10 20:21:41 +08:00
回复了 liubaobei199209 创建的主题 问与答 有没有人爬虫过 APP???求赐教
@Daniel65536 我抓的下载应用是我小,米手机上的应用商店,这是抓的一个地址 http://t1.market.xiaomi.com/thumbnail/webp/l320q80/AppStore/00766c5d9bd20437923ee91393f53ebc9f6525b76 ,我要爬这个 APP 下的 URL 。然后 python 代码如下:
# coding:utf-8
import re
import requests
r = requests.get('http://t1.market.xiaomi.com/thumbnail/webp/l320q80/AppStore/')
data = r.text
# 利用正则查找所有连接
link_list =re.findall(r"(?<=href=\").+?(?=\")|(?<=href=\').+?(?=\')" ,data)
for url in link_list:
print url
我为什么就爬不出来?是不是正则表达式写错了,正确的是怎样的?
2015-12-09 23:37:43 +08:00
回复了 liubaobei199209 创建的主题 问与答 有没有人爬虫过 APP???求赐教
@Daniel65536 你说的用代理找 RESTful 接口,具体怎么操作呢?我还是个没基础没经验的学生?求赐教,谢谢了
2015-12-09 23:34:02 +08:00
回复了 liubaobei199209 创建的主题 问与答 有没有人爬虫过 APP???求赐教
@zqhong 我现在是要怕豌豆荚下每个分类下的前 100 个应用的作者几简介信息,用抓包的话那不是要手动操作无数次吗?
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3546 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 10:50 · PVG 18:50 · LAX 02:50 · JFK 05:50
Developed with CodeLauncher
♥ Do have faith in what you're doing.