1
Kacxxia 2019-02-24 18:49:05 +08:00 1
https://regex101.com
推荐你用这个测试正则,右上会有语法解析 |
2
xiaozaiziwyt OP @Kacxxia 谢谢了。不过重新写代码后发现居然能运行了
|
3
fzinfz 2019-02-25 00:25:26 +08:00 1
写这么长正则解析 html 的教程是为了找人切磋不是教人的吧,劝楼主另寻教程。。。关键词:bs4
|
4
msg7086 2019-02-25 08:10:38 +08:00
比较好的办法是先用正则提取出主要数据,再用 XML / HTML 解析器解成结构化数据,再去读取遍历。
|
5
hakono 2019-02-25 10:42:05 +08:00 via Android
楼主你看的么破教程啊,教人抽取复杂的网页用正则。。。。
乖乖去用 beautiful soup 去,一个 css 选择器就抽出来,节省自己点时间和生命吧 |
6
xpresslink 2019-02-25 11:30:16 +08:00
建议楼主学习 一下 xPath 语法,写代码效率比正则要高多了,在 scrapy 中直接就可以用。 比较容易入手还是推荐 BS4
|
7
E1n 2019-02-25 13:50:19 +08:00 via Android
正则写的爽
|
8
hjq98765 2019-02-25 16:37:12 +08:00
bs4+1
|