安装第三方库

需要安装 openpyxlpandas 库来处理 Excel 文件。
运行以下命令安装:

pip install openpyxl pandas

核心代码逐行解析

以下脚本实现 Excel 数据清洗与格式整理功能:

import pandas as pd

# 读取Excel文件(替换为你的文件路径)
df = pd.read_excel("input.xlsx")

# 删除空值行
df_cleaned = df.dropna()

# 按指定列排序(示例按'销售额'降序)
df_sorted = df_cleaned.sort_values("销售额", ascending=False)

# 保存处理后的文件
df_sorted.to_excel("output.xlsx", index=False)

文件路径修改

  • "input.xlsx" 替换为待处理文件的绝对路径
  • "output.xlsx" 替换为输出文件的保存路径
  • "销售额" 可替换为实际需要排序的列名

批量处理多文件改造

import os

folder_path = "你的文件夹路径"
for file in os.listdir(folder_path):
    if file.endswith(".xlsx"):
        file_path = os.path.join(folder_path, file)
        df = pd.read_excel(file_path)
        # 在此添加数据处理逻辑
        output_path = f"processed_{file}"
        df.to_excel(output_path, index=False)

典型应用场景

  • 自动合并多张报表
  • 快速清洗含空值/重复值的数据
  • 定期生成标准化格式报表

该脚本可直接嵌入日常工作流程,完整版源码包含异常处理与日志记录功能,适合长期自动化运行。

更多推荐