1
sobigfish 2012-02-14 16:41:20 +08:00
很诡异
比如我搜“件为”搜不到,搜“附件为” 就可以. |
2
sobigfish 2012-02-14 16:43:47 +08:00
数字7位搜不到 8位搜的到,貌似是他们索引的问题。
|
3
Errpt 2012-02-14 16:47:02 +08:00
分词技术阿,一般的分词都是按照辞典里面有的词来建索引的。
|
4
ayanamist 2012-02-15 01:07:01 +08:00 1
如果知道这种海量数据的搜索其实是按索引搜索而不是真正的全文搜索,那就能理解这种情况。
对于英文,按照英文习惯,以空格分词,可以匹配所有已知未知的单词,除非这个单词内包含有其它已知的高频单词,否则不可能匹配到,因为不可能无限分词。 中文的问题更为复杂,因为中文里没有空格作为自然分词符,所以只能依赖大词库。所以长久以来中文分词一直效果不好。 |
5
Echoldman 2012-02-15 10:10:36 +08:00
非常同意,确实用着好!
|
6
xiangheka 2012-02-15 13:17:20 +08:00
gmail 也不支持 html写信
|