logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python第三方库Numpy & Pandas

NumPy和Pandas都是Python的第三方库,但是它们的应用场景不同。主要用于处理数值数据,提供了数组来容纳数据,支持并行计算,底层使用C语言编写,效率高。主要用于处理类表格数据,提供了和数据结构,能够处理不同类型的数据,支持数字索引和标签索引,是专门为处理表格和混杂数据设计的。NumPy适合处理统一的数组数据,而Pandas更适合处理结构化数据。总之,Numpy与Pandas库是数据分析的

文章图片
#python#numpy#pandas
Python 条件筛选/过滤 isin、query、contains、loc、iloc

日常数据分析中,经常要根据各种不同的条件从数据集中筛选出想要的数据,再进行提取、替换、修改和分析等操作,因此筛选过滤是数据分析中使用频率最高的操作之一。在刚开始用Python做数据分析的时候,常常是使用for循环在数据集中进行条件筛选,致使代码比较冗长且效率不高。本篇分享一下在python中常用的并且使用效率比较高的几种数据筛选函数:isin()、query()、contains()、loc()、

文章图片
#python#数据分析
Python数据合并/拼接函数concat、append、merge、join

数据分析中经常会遇到补行/列数据 或 数据拼接/合并数据或表格的左右连接——mergejoin;数据或表格的上下连接——append。主要用于表格的左右连接,类似于SQL中的Join操作,根据具体字段来匹配连接既能按轴上下拼接,也能按轴左右拼接,主要取决于参数axis的设定append:追加,只能用于表格的上下连拼,可视作axis=0的简便版concat主要用于表格的左右连接。

文章图片
#python#数据分析
Python 条件筛选/过滤 isin、query、contains、loc、iloc

日常数据分析中,经常要根据各种不同的条件从数据集中筛选出想要的数据,再进行提取、替换、修改和分析等操作,因此筛选过滤是数据分析中使用频率最高的操作之一。在刚开始用Python做数据分析的时候,常常是使用for循环在数据集中进行条件筛选,致使代码比较冗长且效率不高。本篇分享一下在python中常用的并且使用效率比较高的几种数据筛选函数:isin()、query()、contains()、loc()、

文章图片
#python#数据分析
到底了