logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

pandas 10数据预处理

文章目录3.数据清洗3.1检测与处理缺失值1.缺失值的检测:2.缺失值的统计:3.缺失值的处理<1>.删除缺失值: `dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)`<2>.填充缺失值:<3>.DataFrame中用均值填充:3.2检测与处理重复值<1>.检测&lt

数据处理模块(numpy,panads)-案例

数据处理(panads与numpy)模块#读取数据import pandas as pdimport numpy as npfile_path = open('地址')file_date = pd.read_csv(file_path)file_date.head()##tail()#数据预处理file_date.duplicated()#重复值检测file_date = file_date.dr

#python#数据分析#numpy +1
python数据分析与可视化【一】python基础实例

用python做数据分析与可视化(一)python编程基础这一块前面我写过博客,奉上链接:https://blog.csdn.net/qq_43636709/article/details/109448571这篇就来看看几个小实例后面有python很基础的知识点和例子后面数据分析能用上下一更上numpy与pandas的细节实训一1.读取csv文件import csvf = open("D:/大学/

#python#数据分析
数据分析与可视化(三)numpy

数据分析与可视化(三)numpypandas比较重要东西多下一次把这个细节好多啊但常用的也不太多 而且可以在用的时候找的不过还是知道些会一点的好python提供了众多可以支持数据处理的包,因而利用python进行数据分析非常简洁高效,是进行数据分析的不二之选。其中Numpy和Pandas是最为常用的包。Numpy简介NumPy是Python的一种开源的数值计算扩展库。它包含很多功能,如创建n维数组

#python#numpy#数据分析
数据分析与可视化(五)Pandas学习基础二:数据预处理

文章目录1.数据载入1.1读写文本文件(1)文本文件的读取:(2)文本文件的存储1.2读写excel文件t(1).pandas 的read_excel函数可以读取“xls”和“xlsx”两种excel文件(2).Excel文件的存储2.合并数据2.1 merge合并数据2.2concat数据连接2.3combine_first合并数据3.数据清洗3.1检测与处理缺失值1.缺失值的检测:2.缺失值的

#数据分析#pandas
Spark的基础编程

Spark的基础编程Spark的一些基本概念1.RDD:弹性分布式数据集,是分布式内存的一个抽象概念,提供了一种高度受限的共享内容模型,即RDD是只读的记录分区的集合,只能基于稳定的物理存储中的数据集来创建RDD,或者通过其它RDD上执行确定的转换操作(如map,join,group by)来创建,这些限制使得实现容错的开销很低。一个RDD 就是一个分布式对象集合,作为数据结构,RDD本质上是一个

#spark#big data#hadoop
Oracle 日期的转换

to_date()to_date("要转换的字符串","转换的格式")两个参数的格式必须匹配,否则会报错。即按照第二个参数的格式解释第一个参数。to_char(日期,"转换格式" ) 即把给定的日期按照“转换格式”转换。转换的格式:表示year的:y 表示年的最后一位 yy 表示年的最后2位 yyy 表示年的最后3位 yyyy 用4位数表示年表示month的:mm 用2位数字表示月;mon 用简写

#oracle#数据库#database
Hbase表结构与常用操作命令

Hbase表结构与常用操作命令一.使用Hbase前需要先启动Hadoopstart-dfs.sh,然后启动Hbasestart-hbase.sh与Hbase Shellhbase Shell,进入shell命令提示符状态。概念:HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigta

#大数据#hbase
登录注册界面函数

from tkinter import *from pymssql import *import tkinter.messagebox as mbdef sql1(self):#用于查询 有返回值ip = '127.0.0.1'userName = 'sa'passWord = 'lzyft1030'con = connect(ip,userName,passWord)cur = con.curs

#数据库
云计算服务模型和openstack架构常用模块介绍

云计算的服务模型云计算有IaaS(Infrastructure as a Service,基础架构即服务),PaaS(Platform as a Service,平台即服务),SaaS(Software as a Service,软件即服务)三种基本模型。1.IaaS:提供最底层的IT基础服务,包括处理能力,存储空间,网络资源等,用户可以从中获取硬件或者虚拟化硬件资源(包括luo机或者虚拟机),之

#云计算#openstack
    共 11 条
  • 1
  • 2
  • 请选择