php中文网

Pandas 如何实现 COUNTIF 函数统计每行大于指标值的列数?

php中文网

在 pandas 中如何实现 countif 函数?

您想要统计每行中比指定指标值大的列的个数。此问题可以轻松使用 excel 中的 countif 函数解决。但是,在 pandas 中,您可能会遇到像您描述的困难。

问题

您的代码如下:

np.where(data[data.columns[1:]] > data['指标']).count(1)
(data[data.columns[1:]] > data['指标']).sum()

但这些代码返回 0 的结果。这是因为:

  • np.where 返回一个布尔掩码,而不是实际计数。
  • sum() 仅计算布尔掩码中的 true 的数量,该数量始终为 0 或 1。

解决方案

要实现 countif 函数,您可以使用 apply() 方法逐行应用 lambda 函数。代码如下:

data['countif'] = data.apply(lambda x : sum(data['X1':'X4'] > data['指标']),axis =1)
  • lambda x : sum(data['x1':'x4'] > data['指标']) 定义了一个 lambda 函数,该函数获取一行数据 x 并计算大于指标值的元素数量。
  • apply() 逐行应用 lambda 函数,并将结果存储在名为 'countif' 的新列中。

现在,data['countif'] 列包含每行中大于指标值的列的个数。

以上就是Pandas 如何实现 COUNTIF 函数统计每行大于指标值的列数?的详细内容,更多请关注php中文网其它相关文章!