最近有个需求,就是拿到一个网页的源代码,然后找到其中元素对应的 XPath ,在 Python 中完成。
类似于 Chrome 中的"Copy XPath"功能。
伸手党想问一下有没有现成的 Python 库可以解决?
1
leisurelylicht 2016-01-14 15:48:33 +08:00
from lxml import etree
或者 beautifulsoup |
2
exploitcat OP @leisurelylicht 有没有 demo 呢? 可以获取指定 element 的 xpath ?
|
3
bdbai 2016-01-14 17:56:15 +08:00 via iPhone
楼上说的是通过 XPath 选择元素吧。
为什么要用 Python 生成 XPath ?如何确定是哪一个元素? |
4
imn1 2016-01-14 18:36:29 +08:00
同一元素 xpath 有多种写法
最简单的方法是你自己递归父节点,直到 root 节点 |
5
exploitcat OP @bdbai 需求往往不需要解释。。。。
|
6
leisurelylicht 2016-01-15 09:47:12 +08:00
@exploitcat 好像没有,需要你自己生成
|
7
wwxiong 2016-01-15 10:28:32 +08:00
@exploitcat 可以看看 https://github.com/wwxiong/spiders/blob/master/meizi_spider.py 爬虫。里面就是使用 lxml 。
|
8
ruiruirui 2019-12-10 13:53:08 +08:00
楼主是如何解决这个问题的,我现在也有个这么一个需求。
|