logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【python数据处理(3)】批量Excel数据表格合并汇总并生成为一个新的表格保存本地

1. 背景实际操作中,往往会处理一些相同格式的Excel表格数据,比如某商家都是按照每月进行产品A和B的数据的统计,有时为了季度或者年度数据的或者,就需要将多个Excel中的表格数据汇总到一起(不是覆盖),并且表格的标题还不变,也就产生了题目的要求,方便之后的数据处理假设表格中内容如下:(标题相同,但是数据不同,以第一个文件中数据为例)2. 代码编写主要是使用到了pandas里面的co...

#python
【python数据分析实战】国产烂片深度揭秘(5)—— 不同导演每年的电影产量如何?

1 时间序列分析也就是对不同导演电影上映的时间进行整理,就得要求两个字段的数据不能为空值,一个是导演字段,一个就是电影上映日期字段1) 空白数据的清楚df_year = df[(df['导演'].notnull()) & (df['上映日期'].notnull())][['电影名称','导演','豆瓣评分','上映日期']]print(df_year)–> 输出结果为:(...

#python#数据分析#大数据
【python数据分析(20)】Matplotlib库运行前系统参数设置(中文及负号不显示、网格线及透明度、刻度显示)

1、版本选择这里安装的是最新的Anaconda 2020.02版本(下载地址),打开jupyter notebook,新建一个python3文件,首先查看一下matplotlib的版本号,输入如下import matplotlibprint(matplotlib.__version__)–> 输出的结果为:(Anaconda中默认配置的是3.1.3的版本)3.1.32、简单示...

#python#数据分析#matplotlib
【python数据分析实战】知乎数据清洗整理和结论研究(看看人员分布情况和学历如何?)

0. 数据:来自知乎的爬取以及第六次人口普查的数据1. 前期准备导入相关库和设置程序运行路径import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport osos.chdir(r'C:\Users\86177\Desktop')print('finished!')–> 输出的结果...

#python#数据分析#大数据
【python数据分析(23)】Matplotlib库绘图的子图、主次刻度、注解、图表输出

1、 子图1)在matplotlib中,整个图像为一个Figure对象;2)在Figure对象中可以包含一个或者多个Axes对象;3)每个Axes(ax)对象都是一个拥有自己坐标系统的绘图区域1.1 plt.figure绘制子图plt.figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None,fram...

#python#matplotlib
【python数据分析实战】电商打折套路解析(2)—— 各个品牌参与双十一活动的商品数量分布是怎样的?

1. 真正参与双十一活动的商品品牌这里应该包含的数据为双十一当天在售的 + 双十一之前预售的(套路嘛,都懂的,预售的商品会让买家预付定金,然后在双十一当天,当然去年双十一也有部分是在第二天凌晨付账,但是都是属于双十一的购物策略)...

#python#大数据#数据分析 +1
【MapReduce】分析每个部门工资总额的数据处理流程并开发程序

分析每个部门总额的数据处理流程并开发程序1 分析每个部门工资总额的数据处理流程2 每个部门工资总额程序开发2.1 创建框架2.2 开发Mapper程序2.3 开发Reduce程序2.4 执行主程序手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/118964468(CSDN博主:Be_melting)知识梳理不易,请尊重劳动

#java#大数据#hadoop +1
【python数据处理(1)】如何将pandas中的Periodindex中的时间数据提取出来,并转化成时间数值列表数据?

使用period_range生成时间序列标签import numpy as npimport pandas as pddf = pd.DataFrame({'rate':np.random.randn(10)},index = pd.period_range('2001','2010',freq = 'Y'))print(df.index)#输出'''PeriodIndex(...

#pandas#python
【python数据处理】替代Excel三维地图依据经纬度坐标的绘制热力地图的方式

由于某人访问了某地,即便是调整电脑中的区域为别的国家或者地区时候,excel三维地图选择时候依然会弹出很抱歉,三维地图当前不在你的国家/地区使用。这个“当前”不知道要持续多久,所以需要找到一个方式替代excel进行三维地图的绘制。输出的图形文件如下:右侧有下载按钮,可以点击下载图形也可以直接截图保存本地。需要版本在0.5x,而不是最新版的1.x版本。

#python
【python实现网络爬虫22】唯品会商品信息实战步骤详解

唯品会商品信息实战1. 目标网址和页面解析2. 爬虫初探3. 爬虫实操3.1 进行商品id信息的爬取4. 全部代码1. 目标网址和页面解析唯品会官网中假如搜索护肤套装,返回的页面如下下拉右侧滚动条可以发现,滑动到下面的时候页面会自动刷新出商品的数据,这里就体现了ajax交互,说明商品的信息是存放在json接口中,接着拉到底就可以发现翻页的按钮了,如下2. 爬虫初探尝试进行抓包,获取真实商品数据所在

#python#大数据#json +1
    共 142 条
  • 1
  • 2
  • 3
  • 15
  • 请选择