这是一个创建于 4130 天前的主题,其中的信息可能已经有所发展或是发生改变。
业余在做一个机器抓取网上文章在整合发布的网站。现在想用机器学习之类的技术能把文章按不同的内容进行分类,请问应该怎么做?谢谢!
4 条回复 • 1970-01-01 08:00:00 +08:00
|
|
1
likai 2013-08-04 21:28:56 +08:00 via Android 1
中文分词作tag
|
|
|
3
maxint64 2013-08-04 22:17:59 +08:00
分词是第一步,之后是为文章建立模型,然后是做聚类。
|
|
|
4
binux 2013-08-04 22:23:07 +08:00
标记,分词,找个库扔进去训练就完了 如果觉得觉得麻烦,手动提取特征tag
|