V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  sam408130  ›  全部回复第 1 页 / 共 1 页
回复总数  6
2015-11-20 19:01:18 +08:00
回复了 sam408130 创建的主题 Python Django 搭建 blog,部署
2014-03-27 17:39:08 +08:00
回复了 sam408130 创建的主题 问与答 百度音乐搜索的容错技术
@11 嗯,这个我也考虑进去了,在计算编辑距离的时候,如果拼音相同,我就不扣分了
2014-03-27 17:38:19 +08:00
回复了 sam408130 创建的主题 问与答 百度音乐搜索的容错技术
@SkyTodInfi 嗯,我现在用的是倒排表,在门限以内的相似歌曲中,构建前缀树,计算编辑距离,然后结合之前算好的歌曲得分,给出最终结果。其实我的方法效果也不错,就是不知道改怎么提高了。
2014-03-27 17:29:51 +08:00
回复了 sam408130 创建的主题 问与答 百度音乐搜索的容错技术
@xdeng 抓网页肯定不行,用户量上去了,得考虑到自身网络被封的危险性呀,被封了不就gg了
2014-03-27 17:27:28 +08:00
回复了 sam408130 创建的主题 问与答 百度音乐搜索的容错技术
@binux 我这边没有那么多用户数据,目前自己构建一个音乐数据的本题库,使用pagerank计算了节点的重要性,结合百度音乐自带的热度,给每首歌曲,每个歌手一个得分吧,拿这个得分当歌曲歌手最终热度
2014-03-27 17:24:05 +08:00
回复了 sam408130 创建的主题 问与答 百度音乐搜索的容错技术
@xdeng 如果可以掉api,我就不用这么苦恼了
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2864 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 06:39 · PVG 14:39 · LAX 22:39 · JFK 01:39
Developed with CodeLauncher
♥ Do have faith in what you're doing.