V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  demo06  ›  全部回复第 3 页 / 共 5 页
回复总数  93
1  2  3  4  5  
2021-04-05 13:08:21 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@badacook 总结一下,用 xpath 获取 caption 包含 返回数据说明的子标签然后用 /.. 再获取他的父标签(我看了一下页面里面所有 table 的 class 都是 wikitable,用这种方法获取比较准确),然后 toString 后,获得的就是标准 table 表格
2021-04-05 13:04:40 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@badacook 这样改就 OK 了
2021-04-05 13:04:15 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@badacook tables=tree.xpath('//table[@class="wikitable"]/caption[contains(text(),"返回数据说明")]/..')
for table in tables:
print(etree.tostring(table, method='html', with_tail=False))
2021-04-04 12:57:07 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
你贴个 HTML 吧
2021-04-03 17:49:11 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@badacook 我看的是爬虫的这块视频,主要解析 html,刚好有讲 xpath,https://b23.tv/cplcyn
你可以去 B 站看一下,不知道能不能满足你的需求
2021-04-03 15:10:08 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
另外 xpth 最后获取的内容是个集合,如果只有一个值可以后缀[0]取集合第一个下标的值,如果你 xpath 写的不太准确的最后获取的值有多个的话,下标写几就是取第几个值
2021-04-03 15:03:46 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
就我所了解,你这个 tables 还是个 element 对象,你调用的 entree.tostring 方法只是获取了 tables 的对象索引值,如果需要获取 tables 下的子 element 的内容可以用 xpth('.//a[class="className"]/text()'),如果获取节点属性值可以用 xpath('.//a/@attrName/text()')来获取,注意获取子标签下的其他标签时不能有 /table 不然会出错具体什么原因我给忘了,昨天才看完😂,随后我翻翻,还有就是 /text()是获取当前标签下的直属文本内容,//text()是获取当前标签下所有的文本内容,这块刚看完,不知道我理解的对不对
2021-03-14 16:21:15 +08:00
回复了 PeakFish 创建的主题 奇思妙想 大家有遗愿清单吗?
@spark2Fire 一个悲观一个乐观呗
2021-03-14 15:59:55 +08:00
回复了 tuding 创建的主题 奇思妙想 “如何证明照片没有经过处理”的一个 idea
@yolee599 这位兄弟?你做测试的吧?
2021-03-13 20:05:04 +08:00
回复了 maloneleo88 创建的主题 Python 有什么手机 APP 可以跑起来 py 文件吗? IOS、Android 都可以。
别考虑了,去 gayhub 搜搜有没有原生类似软件吧,比你这个效率高多了
@lopetver 你是说后台运行之类的?
2020-12-17 09:50:27 +08:00
回复了 DBQ 创建的主题 Android 安卓手机 push 推送体验真的太差了。
我觉着你这个人不是过来引战就是有其他目的
vx:ZGVtbzA2
2020-11-20 16:00:18 +08:00
回复了 ditie 创建的主题 程序员 又搞了一个仿 Apple Design 的系统,大家看像不像
大哥你可赶紧去找个设计吧
2020-11-06 12:58:34 +08:00
回复了 fdd 创建的主题 生活 亲哥生了一个女儿,该送点啥?
金锁啊
2020-11-04 10:36:54 +08:00
回复了 fyeeme 创建的主题 Android Android 马甲包
+V:ZGVtbzA2(base64)
2020-11-04 10:30:39 +08:00
回复了 qwertyegg 创建的主题 程序员 请教一个 android 生命周期的问题
你在 1 里面跳转 代码后面加个 finish(),貌似 2 就不会再返回 1 了
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3750 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 60ms · UTC 00:52 · PVG 08:52 · LAX 16:52 · JFK 19:52
Developed with CodeLauncher
♥ Do have faith in what you're doing.