我现在有一个有 500 个关键词,现在请求一个 API,需要判断 API 里面的文章标题包含这些关键词,将包含这个的 500 个关键词中的一种的文章存下来,这样每一篇文章需要 500 次,效率有点低,有什么效率比较高的方法?用的是 php 语言
1
liprais 2017-11-13 16:20:34 +08:00
关键词 bloom_filter
|
2
mx1700 2017-11-13 18:59:41 +08:00 via Android
AC 多模式匹配应该可以
不过在 php 里不一定快,因为 php 对象没法常驻内存,每个请求都构造字典估计比循环 500 次还慢 另外可以试试搞成一个超大的正则表达式 |
3
gouchaoer 2017-11-13 19:04:21 +08:00 via Android
|
4
gouchaoer 2017-11-13 19:06:16 +08:00 via Android
500 次效率不是问题,就笨方法最好
|
5
gouchaoer 2017-11-13 19:07:23 +08:00 via Android
正则不能提高效率吧
|