现在但凡涉及到一点数据分析影子的系统里面都有漏斗这么个报表。 而且更难懂的是窗口期这么个概念,也就是说一个人从第一步到最后一步有个时间范围,超过了这个范围就不列入统计数据了。
我能想到最傻大黑粗的办法就是先用第一步过滤出一帮人,然后一个人一个人撸,在时间范围内并且符合下面步骤的就加 1,没有就是 0,这样返回一个数组,例如漏斗有 5 步,这个人在窗口期内做了前四步,就是[1,1,1,1,0],然后所有人的数组叠加起来就是最终统计结果。
但是一旦数据量大起来,比如第一步就过滤出了 100w 人,这种做法感觉绝对超慢啊。
有做过类似功能的大佬么,是否还有什么正确姿势解锁这个问题?