php中文网

如何使用Pandas高效计算当前行以上比当前行值大的个数?

php中文网

pandas获取当前行以上比当前行值大的个数

在pandas中,我们可以利用强大的矩阵计算功能来高效获取当前行以上比当前行值大的个数,从而避免使用低效的循环。

首先,我们需要定义一个lambda函数count_larger来计算给定列表x中大于其最后一个元素的元素个数:

count_larger = lambda x: np.sum(x > x[-1])

然后,我们可以使用列表解析式为每个行的col3值应用count_larger函数,并创建新列col4来存储结果:

df['col4'] = [count_larger(df[:i + 1]['col3'].values) for i in range(len(df))]

这样,新列col4就存储了每一行中当前行值以上比当前行值大的个数。例如,对于col3值为3的行,col4值为0,因为在这一行以上没有比3更大的值。而对于col3值为11.1的行,col4值为7,因为在这一行以上有7个比11.1更大的值。

以上就是如何使用Pandas高效计算当前行以上比当前行值大的个数?的详细内容,更多请关注php中文网其它相关文章!