1
chlx 2013-11-01 10:02:03 +08:00
可行但是准确率达不到100%.分类器不是关键,这种短文本的分类任务中,特征更重要。
|
2
wizardoz 2013-11-01 11:28:09 +08:00
这个是数学建模题吧,这种题不可能100%准确的。考量标准是你的模型分类的正确率。
|
3
brikhoff 2013-11-01 14:37:47 +08:00
500块我给你分,我人工分^_^
|
4
zzNucker 2013-11-01 14:57:13 +08:00
标题么? 那用统计方法是有点难
|
5
solos 2013-11-01 15:39:31 +08:00
试下余弦定理计算相似性
|
7
miaoever 2013-11-01 16:55:12 +08:00
一般用贝叶斯分类起吧。不过,标题一般比较短,能够提取的特征不多,再加上只有 500 条已知类别的,估计效果不会太好。
|
10
solos 2013-11-01 18:14:07 +08:00
关键词聚类行不? https://code.google.com/p/word2vec/
|
11
efi 2013-11-02 06:27:55 +08:00
只有正样本,没有负样本,不可能做分类。可以做回归分析,比相似性,设阈值取类,正确率无保证。
|
12
holy_sin 2013-11-04 09:29:55 +08:00
svm ?
|