用了 xml.dom.minidom,加载个 100M 的 XM 的文件用了 60s,好慢
1
no1xsyzy 2021-05-12 15:28:10 +08:00 1
|
2
wellsc 2021-05-12 15:29:01 +08:00
换语言
|
3
imn1 2021-05-12 15:46:54 +08:00 2
100M 的应该什么语言都用流式解析吧,整体加载 DOM 太大了,非常耗资源
找 xml parser 相关的库,例如 sax |
4
abersheeran 2021-05-12 22:20:49 +08:00 via Android
@no1xsyzy 提到这玩意儿。我想起来以前写一个页面解析的时候,用 docker 跑的,阿里云 Serverless 上 lxml 怎么都解析不出来,我本机次次跑都没问题,最后还是换了 html.parser 。
|
5
ALLROBOT 2021-05-13 08:29:47 +08:00
用 C/C++最快
python 执行速度比它们慢多了 |
6
wohenfuyou OP 改用 c++ tinyxml2 了 就 2s 钟,差距也太大了
|