1
sinreal 2012-04-07 23:04:26 +08:00
大概方法:提取首页关键字,根据关键字和训练数据中做匹配。具体实现,这个要问推荐系统,自然语言处理的同学说说,有没有现成的库?
|
2
args 2012-04-07 23:08:34 +08:00
我觉的就是把别人对这条链接的tag排序,然后输出最前面几个。
|
3
chouj 2012-04-07 23:26:15 +08:00
我在推特上弄了个机器人,自动输出Delicious的“rss”tag条目。发现最近机器人发出来好多“porn”和“adult”内容( http://delicious.com/tag/recent/rss ),于是我发信问Delicious。人回信曰:
"Delicious has no control over the tags users assign to their links, so any time you browse the recent or popular list for all users' tags, there is no way for us to filter the content that are displayed. It seems some on Delicious are saving their adult links for their RSS feed, and are tagging them as such." 也就是说,你搞一堆Delicious马甲收藏某光诚的页面,然后统一打上“锦涛”的tag,就能让“锦涛”这个Delicious tag输出一个光诚的页面。。。 希望对你有帮助。 |
4
caomu 2012-04-07 23:34:24 +08:00 via Android
这个就是分众分类法啊,delicious之后就流行了,人肉的力量。
然后推荐的时候应该就是推荐排名靠前的……不过这里面应该要有一些干预的算法,像PageRank那样,避免故意的捣乱。 其实我觉得delicious对数据挖掘得不够充分应该还有更好用的书签服务的。。。 |
7
wening OP @caomu 嗯,我也觉得啊,我再想google+1和delicious合起来的话,会是怎么一个情况啊
比如,我对一个网页加一,同时就生出了tag收藏 |
8
superisaac 2012-04-08 10:01:55 +08:00
TF.IDF算法啊
|