linux+pycharm+anaconda`

#两个series数据运算 + —  × / **
num=pd.DataFrame([[1,2,3],[3,4,6]],columns=["数据一",'数据二','数据三'])
 #加
num["数据一"]+num["数据二"]
#减
num["数据二"]-num["数据一"]
#乘法
num["数据三"]*num["数据一"]
#除法
num["数据三"]/num["数据一"]
#幂
num["数据三"]**num["数据一"]

#比较运算,返回bool值组成的series值
num["数据三"]>num["数据一"]
num["数据三"]<num["数据一"]
num["数据三"]==num["数据一"]
num["数据三"]!=num["数据一"]

#sum()求和对某与区域内数据进行累加
num.sum(axis=1)
num.sum(axis=0)
num["数据三"].sum()

#mena()求均值
num.mean(axis=1)
#求最大max()求最小min()
num["数据三"].min()
num.max(axis=0)

#求中位数
num.median(axis=1)

#众数
num.mode(axis=0)
num.mode()

#求方差
num.var(axis=1)

#标准差
num.std()

#四分位数
num.quantile(0.25)
num.quantile(0.75,axis=1)

#相关性运算
num["数据一"].corr(num["数据二"])
#两两间的相关性
num.corr()

data=pd.DataFrame([[20,99999,6],[30,999999,6],[20,999994],[27],[30,999999,6]])
 data.columns=["年龄","收入","家属数"]
data.index=[i for i in range(5)]
#count运算,统计非空数据个数
data.count()
data["家属数"].count()


Logo

更多推荐