1
stamaimer 2016-11-16 12:37:36 +08:00 via iPhone
xpath ,有个库叫 lxml
|
2
rainysia 2016-11-16 12:47:48 +08:00
1, py 怎么取这文本就不说了吧
2, 用 HBase thrift 写 或者 openTSDB |
3
f8281113 OP 有没有哪位使用过 bulk load
|
4
wmttom 2016-11-16 14:13:02 +08:00
pyquery 写 css 选择器比写 xpath 更简单点
|
5
ubear1991 2016-11-16 15:49:37 +08:00
thrift
|
6
Wien 2016-11-16 18:10:47 +08:00
bulk load 适合一次性导入到大量数据,而不适合持续导入。如果用 bulk load ,可以先用 python 读取数据到文本文件( csv 等)再通过 hadoop 的 MR 将数据转化成 HFile ,最后用 bulk load 直接导入 Hbase 。
|
7
wellsc 2016-11-16 18:20:58 +08:00 via Android
pyspark
|