V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
lsylsy2
V2EX  ›  问与答

求推荐算法,用户行为预测方面

  •  
  •   lsylsy2 · 2015-04-21 11:10:39 +08:00 · 4453 次点击
    这是一个创建于 3515 天前的主题,其中的信息可能已经有所发展或是发生改变。
    简要概括
    学习用数据:若干的用户访问日志(带时间戳)
    输入:用户当前的一个访问
    输出:用户接下来可能的访问
    要求:看重准确率高过召回率

    目前的想法是把“一段时间内,用户先后访问了A和B”设置为AB之间的一条有向边,然后构造出一张图在里面处理。但是没有想出很明确的算法……
    现有的各种数据挖掘工具有处理这种问题的现成算法么?
    8 条回复    2015-04-21 13:00:23 +08:00
    binux
        1
    binux  
       2015-04-21 11:24:02 +08:00   ❤️ 1
    你想多了,输入只有「当前的一个访问」,统计这「一个访问」最多的下一个访问就完了。
    lsylsy2
        2
    lsylsy2  
    OP
       2015-04-21 11:35:50 +08:00
    @binux 需要的不是“下一个”,而是“下若干个”;
    具体的说是“输入用户当前的访问,输出一个集合,集合内是用户接下来若干时间(比如半小时)内可能访问的东西”
    lsylsy2
        3
    lsylsy2  
    OP
       2015-04-21 11:38:06 +08:00
    然后“看重准确率高过召回率”的意思是
    P(集合内的某个元素被访问)优先级大于P(用户访问的元素在集合内)
    所以这个集合不能过大而包罗万象
    yangff
        4
    yangff  
       2015-04-21 12:51:56 +08:00 via Android
    隐马?
    aszxqw
        5
    aszxqw  
       2015-04-21 12:54:29 +08:00
    @binux 哈哈,真相就是这么简单。但是就是这么实用。
    yangff
        6
    yangff  
       2015-04-21 12:56:02 +08:00 via Android   ❤️ 1
    哦。。就是马尔可夫模型。。
    mfinal
        7
    mfinal  
       2015-04-21 12:57:34 +08:00   ❤️ 1
    带顺序的时间戳预测属于比较高级的了,应该需要用到带记忆功能的时序算法。
    @binux 的意思是你的输入太少了,如果你的模型不能从学习数据中构建出接下来用户的profile,那仅根据新用户当前的“一个访问”来预测之后会很差。
    lsylsy2
        8
    lsylsy2  
    OP
       2015-04-21 13:00:23 +08:00
    @mfinal 唔,我可以用一定的办法保证用户行为由比较高的一致性……也许我可以先用一些办法对用户进行“分类”。

    @yangff 我去看看马尔可夫模型……可能挺有用的样子
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5914 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 02:21 · PVG 10:21 · LAX 18:21 · JFK 21:21
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.