在用pd.cut(pd.Series, bins=bins, right=False).value_counts()
对某一列值的区间数量进行统计
我想要左闭右开,但是最后一个区间要左右都是闭区间, 也就是这样
查阅了文档,只能左开右闭然后加上include_lowest=True
让第一个参数的左区间变为闭区间,想了解一下有没有right=False, include_largest=True
这样的实现方式
1
TimePPT 2022-10-08 16:12:40 +08:00
蹲一个解决方案,我之前也遇到这个问题,最后因为都是整数,所以取巧把分箱最大值改成 1000.0000001 了😂
|
2
HashV2 OP @TimePPT #1 没找到合适的方案,不过我的区间数值本来就是对列全覆盖的,bins 最后一个值可以给 np.inf ,然后替换 labels ,勉强算是实现了吧
bins = [0, 100, 200,....900, np.inf] labels=['[0, 100)', '[100, 200)', ...., '[900, 1000]'] pd.cut(pd.Series, bins=bins, right=False,labels=labels).value_counts(sort=False) |
3
Eureka0 2022-10-08 17:17:13 +08:00
给 pandas 提 issue 加个 include_highest 参数(狗头
|