Pandas 如何获取 DataFrame 中比当前行值大的数据个数?

ID:21096 / 打印

pandas 如何获取 dataframe 中比当前行值大的数据个数?

pandas 获取比当前行值大的数据个数

本问题要求我们从给定 dataframe 中的 col3 列中,查找每个当前行值向上寻找到的第一个比当前值大的值的索引位置。

一个高效的解决方案是利用 numpy 的矩阵运算。具体步骤如下:

  1. 定义一个 lambda 函数 count_larger,用于计算一个数组中比其最后一个元素大的元素的个数。
  2. 使用列表解析生成 col4 列的值,其中 i 标识当前行索引。
  3. 使用 lambda 函数 count_larger,对 col3 列中从当前行到开头(含开头)的子数组进行计数。
import numpy as np  df['col4'] = [count_larger(df[:i + 1]['col3'].values) for i in range(len(df))]

输出:

    col1  col2  col3   col4 0    5.5   2.5  10.0    0 1    2.0   4.5   1.0     0 2    2.5   5.2   8.0     1 3    4.5   5.8   4.8      0 4    4.6   6.3   9.6      3 5    4.1   6.4   9.0      0 6    5.1   2.3   3.0      0 7    5.1   2.3  11.1      7 8    5.1   2.3  10.0      0 9    5.1   2.3  11.1      1 10   5.1   2.3  20.0      10 11   5.1   2.3  31.0       11 12   5.1   2.3   5.0       0
上一篇: 为什么 Python 在科学领域比 JavaScript 更受欢迎?
下一篇: Python代码显示“ModuleNotFoundError”,但pip list已安装matplotlib,这是怎么回事?

作者:admin @ 24资源网   2025-01-14

本站所有软件、源码、文章均有网友提供,如有侵权联系308410122@qq.com

与本文相关文章

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。