目录

1.导入模块       

2.Pandas预处理数据:

        2.1合并6份考研数据120000条+

        2.3数据去重

        2.4数据去空

        2.5数据筛选

3.绘制图形:

        3.1统计每个学校有多少个专业前十名并绘制柱状图

        3.2 筛选计算机科学与技术专业收分最高的前十所学校及分数

        3.3 筛选软件工程专业收分最高的前十所学校及分数

4.根据统计数量绘制词云图:

        4.1生成学校词云图

        4.2生成专业词云图

5.统计每个专业的最高分最低分和平均分:

6.统计地区大学数量占比:绘制饼状图

7.数据再分析:

        7.1各省份本专科占比:直方图对比

        7.2各省份本专科占比:直方图对比

        7.3不同大学类型占比:饼状图

8.1数据建模

        8.1建模前数据预处理

        8.2建模前测试

        8.3建立K-means模型

        8.4模型评估

原创百度网盘资源:

链接:https://pan.baidu.com/s/1c_-RMjerTSw4NY85lrB6rQ?pwd=py66 

说明:转载请标明出处

Logo

汇聚原天河团队并行计算工程师、中科院计算所专家以及头部AI名企HPC专家,助力解决“卡脖子”问题

更多推荐