以下内容无脑发布:
假设,有个脚本,实时获取搜狗的最新词库和微博热搜内容整理成搜索词库。
假设,有 N 台性能强悍的 Elastic 组成的搜索集群。
然而是不是就是说现在可以得到一个近乎完美的“精准”搜索结果了?比如根据社会热度排序,网络搜索多的靠前……等
1
kslr 2015-09-08 16:32:57 +08:00
这个我觉得你可以去看百度指数
|
2
dbfox 2015-09-08 16:34:06 +08:00
我觉得搜索,需要收集用户习惯,所在场景,还有当前用户的状态(用户在什么地方,用户在干嘛,用户的周边环境等),才能达到精准搜索
|
3
xunyu 2015-09-08 16:40:43 +08:00
很遗憾这不可能实现,数据多了会打架,加上人的主观因素不可能有个完备的解决
|
4
ssaul 2015-09-09 10:34:09 +08:00
最早的搜索引擎,应该就是根据关键字来查找,最近的 10 年,似乎大家都开始使用一些其他的因素来关联,试图获得输入者“原本想要得到的结果”。
其实对比 google 和百度这样的搜索引擎,作为一个技术人员,我觉得 google 的结果,明显关联度与我的本意更加接近。 我一直在想:这是为毛呢? 初步的想法是 google 有一个后台的搜索历史数据库,根据关键字来存储,然后根据后续的点击来判断属于某个关键字的大群输入者,到底是想获得一个什么样的链接作为结果。 当然,我不是研究搜索引擎的,其实根本就是瞎想。 所谓的精准,无非就是输入者得到的结果,基本都是自己想要的。但是这很难,因为任何人 /程序都无法预计某一个具体的输入者,在输入某个关键字的时候,他想要获得的结果。 google 和百度的差异,也许只是那个后台的搜索历史数据库和具体的排序算法的区别。当然,百度还收钱,搞排名...... |