python实现excel数据自动统计

2024-07-03 1640阅读

 

python实现excel数据自动统计
(图片来源网络,侵删)
  • 读取数据:首先,使用pandas读取Excel文件中的数据。

  • 分组:使用groupby根据指定的分组列对数据进行分组。

  • 统计次数:自动统计每组的指定列中每个唯一值出现的次数,和统计满足特定条件的计数

  • 保存:将需要的统计结果保存在新的文件中

    import pandas as pd
    # 定义一个函数来计算特定值组合的计数  
    def count_specific_values(group, target_rs, target_lcd_s):  
        # 筛选特定值组合的行  
        filtered = group[(group['rs'] == target_rs) & (group['lcd_s'] == target_lcd_s)]  
        # 返回计数  
        return len(filtered)
    file_path_1 = r'1.xlsx'  
    sheet_name_1 = 'a' 
    file_path_2 = r'2.xlsx'  
    sheet_name_2 = 'b' 
    df_succes = pd.read_excel(file_path_1,sheet_name=sheet_name_1)
    df2_fail = pd.read_excel(file_path_2,sheet_name=sheet_name_2)
    # 合并数据
    df_data_total = pd.concat([df_succes, df2_fail], axis=0)
    # 按name号分组
    grouped_data = df_data_total.groupby("name")
    # 使用pivot_table计算每个name组中的数据
    auth_pivot_table = grouped_data["rs"].value_counts().unstack(fill_value=0) #rs的值分为0 2 4
    # 计算0的次数
    auth_pivot_table['0_cnt'] = auth_pivot_table[0]
    # 计算2的次数
    auth_pivot_table['2_cnt'] = auth_pivot_table[2]
    # 计算4的次数
    auth_pivot_table['4_cnt'] = auth_pivot_table[4]
    # 计算AA次数
    auth_pivot_table['AA'] = grouped_data.apply(lambda x: count_specific_values(x, 0, 2))
    # 重置索引
    auth_pivot_table.reset_index(inplace=True)
    #选取特定列输出
    result = auth_pivot_table[['name', '0_cnt', '2_cnt', '4_cnt', 'AA']]
    # 重命名列名
    result.columns = ['name', '0_cnt', '2_cnt', '4_cnt', 'AA']
    # 保存结果到Excel文件
    result.to_excel("name.xlsx")
    print('save succ.')
    

     

     

VPS购买请点击我

免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们,邮箱:ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

目录[+]