#!/usr/bin/env python
#-*-coding:utf-8-*-

'''
使用pandas处理excel数据
'''

import pandas as pd

def   readExcel1():
    #默认读取第一个sheet
    df  = pd.read_excel('pandastest.xlsx')
    data =df.head()
    print('获取到的数据:\n{0}'.format(data))

def   readExcel2():
    #sheet_name指定sheet
    df  = pd.read_excel('pandastest.xlsx',sheet_name='mysheet2')
    data =df.head()
    print('获取到的数据:\n{0}'.format(data))

    #通过表单索引指定访问的表单
    df1 = pd.read_excel('pandastest.xlsx',sheet_name=0)
    data1 =df1.head()
    print('获取到的数据:\n{0}'.format(data1))



def   readExcel3():
    #sheet_name指定多个sheet
    df  = pd.read_excel('pandastest.xlsx',sheet_name=['mysheet1','mysheet2'])
    data =df.values
    print('获取到的数据:\n{0}'.format(data))


def  readData():
    df = pd.read_excel('pandastest.xlsx')   
    #读取指定行的数据,数据存在列表中
    data1 = df.iloc[0].values
    print('读取指定行的数据:\n{0}'.format(data1))
    #读取指定的多行,数据嵌套在列表中
    data2 = df.iloc[[1,2]].values #读取第二行和第三行的数据,需要在iloc[]里面嵌套指定行数
    print('读取指定行的数据:\n{0}'.format(data2))
    #读取指定的行列
    data3 = df.iloc[1,2] #读取第二行第三列(C2)的数据,不需要嵌套列表
    print('读取指定行的数据:\n{0}'.format(data3))
    #读取第三行第四行[2,3]的id,username[0,1]
    data4 = df.iloc[[2,3],[0,1]].values 
    print('读取指定行的数据:\n{0}'.format(data4))
    #打印标题
    print('列名称:',df.columns.values)

    #逐行遍历
    nrows = df.shape[0]
    ncols = df.columns.size
    print('max rows:',str(nrows))
    print('max columns:',str(ncols))
    
    for iRow in range(nrows):
        for iCol in range(ncols):
            print(df.iloc[iRow,iCol],end="\n")

def  saveData():
    nan_excle = pd.DataFrame()
    nan_excle.to_excel('savapandas.xlsx')


if __name__ == "__main__":
    readData()
    saveData()
    pass
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐