如何用Python统计分类列数据在不同日期的出现次数?

ID:21536 / 打印

如何用python统计分类列数据在不同日期的出现次数?

如何统计转换列转数据

想要将转换后的列转换为统计数字,可以使用以下步骤:

1. 虚拟化转换列

使用 pd.get_dummies() 函数将转换列转换为虚拟列,每个类别创建一个布尔列,其中 1 表示存在,0 表示不存在:

立即学习“Python免费学习笔记(深入)”;

df_dummies = pd.get_dummies(df, columns=['type'])

2. 分组和求和

使用 df.groupby() 根据日期对虚拟列进行分组,然后使用 sum() 求出每个日期每个类别出现的次数:

df_group = df_dummies.groupby("date").sum()

3. 输出结果

现在,df_group 将包含按日期统计的每个类别的数量:

print(df_dummies) print("-". * 60) print(df_group)

输出结果如下:

          date  type_1  type_2  type_3  type_4  type_5 0   2024-01-01       1       0       0       0       0 1   2024-01-01       0       1       0       0       0 2   2024-01-01       1       0       0       0       0 3   2024-01-02       0       0       1       0       0 4   2024-01-02       0       1       0       0       0 5   2024-01-02       0       0       1       0       0 6   2024-01-02       1       0       0       0       0 7   2024-01-02       1       0       0       0       0 8   2024-01-03       1       0       0       1       0 9   2024-01-03       0       0       0       1       0 10  2024-01-03       0       1       0       0       0 11  2024-01-03       0       0       0       0       1 ------------------------------------------------------------ type_1  type_2  type_3  type_4  type_5           date                                                         2024-01-01       2       1       0       0       0           2024-01-02       2       1       2       0       0           2024-01-03       1       1       1       1       1
上一篇: Python 3.12中__int__写错导致报错:如何正确初始化类属性?
下一篇: Pylance类型检测报错:如何解决自定义装饰器导致的类型错误?

作者:admin @ 24资源网   2025-01-14

本站所有软件、源码、文章均有网友提供,如有侵权联系308410122@qq.com

与本文相关文章

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。