系统将用户上传的 Excel,放在 ES 查询,供检索。但是 Excel 的表头可以自定义的,这样会导致一个索引下面的字段太多
这种情况有什么好的优化方式么
或者表头不映射成字段,有没有更好的存储呢
1
chendy 2021-09-07 14:36:13 +08:00
直接把 excel 所有内容读出来做一个字符串保存然后搜索怎么样?
|
3
Itoktsnhc 2021-09-07 15:35:31 +08:00
牺牲表头列的可读性
做表头->col_id 的映射,col_id 自增,按照范围拆分索引 实际查询的时候从映射中获取实际的列,再到 es 中查询 |
4
Itoktsnhc 2021-09-07 15:39:21 +08:00
@Itoktsnhc 比如 col_id (0,29) 在索引 xxx_0; col_id(30,59)在索引 xxx_1. 按照映射关系分别查询
另外感觉需要注意的就是 需要 id 或者什么来表明不同索引内的是同一条记录 |
5
cco 2021-09-07 15:41:44 +08:00
试试 hbase + es 配合使用呢? ES 存 rowkey,Hbase 存数据。
|