V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
pppwww
V2EX  ›  Starbucks

[请教] 有木有大佬用 StarRocks 做过用户路径分析的哇

  •  
  •   pppwww · 11 天前 · 314 次点击

    rt,小弟目前要做一个基于 starRocks 的路径分析功能,参考火山引擎/神策数据,但是这两个平台没有展示 sql ,小弟感觉有点难以下手。

    目前的思路是: 1 、首先要做到会话识别,通过窗口函数等操作将数据划分为一个个的会话 2 、从这个会话上识别出路径,然后 group by 统计信息等

    上面的思路目前还是很模糊,有木有搞过的大佬分享下经验,万分感谢

    5 条回复    2025-02-16 23:04:44 +08:00
    pppwww
        1
    pppwww  
    OP
       11 天前
    手抖点错了,删掉删掉
    Jim2Chen
        2
    Jim2Chen  
       9 天前
    有思路了没?学习一下
    pppwww
        3
    pppwww  
    OP
       9 天前
    @Jim2Chen 用 4 层窗口函数实现了一个版本,但是查询性能感觉不是很好.. 4 个行为,13E 数据要 30s
    Jim2Chen
        4
    Jim2Chen  
       8 天前
    @pppwww 能发一下吗?参考一下
    pppwww
        5
    pppwww  
    OP
       6 天前
    @Jim2Chen 有空了写个文章分享下,目前整理的方案和公司的数据结合的比较多,不方便直接发,主要步骤就是:
    1 、如何识别会话
    通过窗口函数,计算相邻两次行为的时间间隔,按照规定的 sessionPeriod 切割会话
    2 、识别会话后,如何实现路径的裁剪
    通过窗口函数,找到路径的起始或者结束节点,然后进行一次裁剪
    再次通过窗口函数,对每个会话的行为节点编号,进行一次深度上的裁剪
    3 、最终返回给展示层的数据格式
    这里有两种返回形式,一种是直接返回路径,然后业务层做计算,另一种是返回节点对之间的统计信息。可以根据业务需求自由选择
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   970 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 19:38 · PVG 03:38 · LAX 11:38 · JFK 14:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.