我有一个很长的 dataframe,100w 左右吧, df = pd.DataFrame(columns =['id']),我现在想要重新计算一个新列, 逻辑是 在第 i 行,利用第 i,i-1,i-2 的 id 列三个数值计算,我现在是用循环计算的,感觉很慢,非常丧,用多线程啥的感觉好像太重了
不知道大家有什么好的方法,感谢
1
llsquaer 2020-05-10 21:39:16 +08:00
没明白你具体..如果计算其中三行 某列的数据,直接取 index 就行了啊..100w 数据也是毫秒的事情..还用什么循环?
|
2
imn1 2020-05-10 22:00:51 +08:00 1
你搜搜官方文档关于移动统计的章节,应该是“Expanding Windows”相关的内容
移动统计就是用前 n 行数据计算当前新数据,时序类型数据经常需要,例如证券 |
3
liprais 2020-05-10 22:02:40 +08:00 via iPhone
sql window function lag
|
4
yzc27 2020-05-10 22:06:03 +08:00 via iPhone
用 apply()?
|
5
renmu 2020-05-10 22:16:38 +08:00 via Android
d[i]=d[i-1]+d[i-2]这样?,直接操作
|
7
Latin 2020-05-11 11:38:33 +08:00
|