数据库中有 10w 条没有分类的文章,含有标题,内容(文本),创建时间等等字段
现在需要将这 10w 数据分到政策,行情,军事等等 7 个分类下
有没有好的解决方案
1
maemolee 2018-12-03 17:10:01 +08:00
对七个分类预设一批关键词,去匹配?我瞎说的,抛砖引玉。
|
2
xiaoxinshiwo 2018-12-03 17:21:19 +08:00
分表
或者 es |
3
gsscsd 2018-12-03 17:23:45 +08:00 via Android
tfidf+机器学习多分类或者词向量+深度学习多分类
|
4
banks0913 2018-12-03 17:24:34 +08:00
scikit-learn,利用朴素贝叶斯分类器训练模型
|
5
to 2018-12-03 18:01:05 +08:00 via Android
小批量训练个模型就好了
|
6
yangzhezjgs 2018-12-03 22:59:11 +08:00 via Android
文本分类了解一下
|