1
aihimmel 2016-10-20 22:55:53 +08:00 via Android
你需要 html 解析
Bs4 或者 lxml |
3
182247236 OP @aihimmel 下面的就调用的 bs4 模块,可是只能这样吗?我当时想着把下面的 print(link.get_text()) 以同样的方式套用到上面的那段码,结果不行。
|
4
Lonely 2016-10-20 22:58:44 +08:00 via iPhone
简单点就用正则好了
|
5
182247236 OP @popu111 因为 url = urlopen(GetPlayer)这段就可以把 url 提取出来了,可是包含了 /a 标签,我觉得应该是有办法简单点只提取 url 的,当然可能是我刚接触计算机语言不太懂 TT
|
7
lxy 2016-10-20 23:14:15 +08:00
这还嫌复杂啊……那就用正则+requests
import re, requests GetPlayer = '...' re.search('>(.+?)<', requests.get(GetPlayer).text).group(1) |
10
stamaimer 2016-10-21 00:36:28 +08:00 via iPhone
用 xpath 提取 href 熟悉
|