1
oaix 2018-06-25 14:47:06 +08:00
是很慢的. 简单字段匹配也是要把整个 es 扫一遍.
spark 读带 shard 的 mongo 会快一点. 最好是把 es 的数据定期写到 hdfs 里面去. |
2
Mvpanswer7 OP @oaix 用 elasticsearch-spark 是会 pushdown 的啊,而且是 scroll 方式
|
3
oaix 2018-06-25 22:46:20 +08:00
@Mvpanswer7 你可以把 `用 elasticsearch-spark 是会 pushdown 的啊` 的来源发出来吗?
rdd 在 filter 的时候,传参是你自定义的 java 方法,我不认为 elasticsearch-spark 可以这个自定义的过滤翻译成一个 es 查询。 |
4
oaix 2018-06-26 09:31:45 +08:00
我知道你说什么了, 你用的是 spark SQL
|
5
bzzhou 2018-06-26 09:37:15 +08:00
贴一下 explain ?确认查询是否真的 pushdown 到了 es
|
6
Mvpanswer7 OP @oaix 是的是的
|
7
Mvpanswer7 OP @bzzhou 能打印出来 pushdown 后的 query 里确实有 sql where 里的条件
|