1.项目背景与简介

  在日常的企业人力资源管理中,薪酬数据的统计与分析往往繁琐且易出错。传统的手工 Excel 处理方式效率低下,难以应对大规模数据。

  本项目旨在利用 Python 强大的数据处理能力,构建一套自动化的薪酬绩效分析系统。系统能够从 MySQL 数据库读取原始数据,利用 Pandas 进行清洗与计算,最终生成可视化的图表与标准化的 Excel 报表,为管理层提供决策支持。

2. 技术栈

  • 编程语言:Python 3.x
  • 数据库:MySQL (存储员工信息与薪资明细)
  • 数据处理:Pandas, NumPy
  • 数据库连接:PyMySQL
  • 数据可视化:Matplotlib
  • 开发工具:VS Code

3. 数据库设计

  为了模拟真实场景,我们设计了两张核心表:employees(员工基本信息)和 salaries(薪资明细表),通过 emp_id 进行关联。
 3.1创建数据库和表

3.2插入数据

3.3修改一下数据,模仿真是场景

4. 核心功能实现

4.1 数据获取与连接

使用 pymysql 建立数据库连接,并通过 pd.read_sql 直接执行 SQL 多表查询,将数据加载到 DataFrame 中。

4.2.数据清洗于特征工程(关键步骤)

4.3数据分析(核心逻辑)

4.4数据可视化

4.5导出图片以及展示图

4.6关闭连接以及测试

5.运行结果

5.1数据可视化

5.2Excel表导出

6.总结

  本项目完整实现了从数据提取、清洗、分析到可视化的全流程。通过该项目,不仅加深了对 Pandas 数据处理逻辑的理解,也掌握了 Python 在实际企业场景中的应用。

    更多推荐