logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SPSS缺失值处理

均值替换法:适用于连续数据(定量数据),缺失数据占比不超过10%。可直接生成新的数据列中位数替换适用于等级变量例如满意度。(定性变量先要在变量试图中数值代替)需要手动输入(根据频率结果选定替换值,然后升序拍排列-空值置顶, 最后输入替换值)众数替换适用于分类变量例如性别。(定性变量先要在变量试图中数值代替)其余同中位数操作。回归估计法同EM法。期望最大化法(EM)最优的缺失值处理法。(是先求期望,

时间序列之协整检验(3)

一、基本概念1. 协整检验(cointegration test)协整的作用检验它们的回归方程所描述的因果关系是否是伪回归的。协整是指若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳性。协整理论的作用在于正确地解释了经济现象和预测现象,误差修正模型(ECM) 将影响变化的因素有效地分解成长期静态关系和短期动态关系之和。其中格兰杰定理证明了协整关系与误差修正模型之间的关系,指出若干个一阶非

SPSS-线性回归

R方—变量之间是否有相关性【模型汇总表】中R表示拟合优度,值越接近1表示模型越好(但不能说他们之间不相关,可能是非线性相关),一元线性回归里,相关系数平方就是R方。方差分析F检验—变量之间是否有线性关系【Anova表】表示分析结果,主要看的是F和Sig值,F值对应的Sig值小于0.05就可以认为回归方程是有用的回归系数t检验—回归方程的系数是否显著【系数表】sig均小于0.05表示自变量对因变量有

时间序列之格兰杰因果关系检验(4)

一、格兰杰因果检验1. 因果情况讨论(1)(2)式(1)假定当前y与y自身以及x的过去值有关,而式(2)对x也假定了类似的行为。对式(1)而言,其零假设H0 :α1=α2=…=αq=0。对式(2)而言,其零假设H0 :δ1=δ2=…=δs=0。分四种情形讨论:(1)x是引起y变化的原因,即存在由x到y的单向因果关系。若式(1)中滞后的x的系数估计值在统计上整体的显著不为零,同时式(2)中滞后的y的

SPSS-线性回归

R方—变量之间是否有相关性【模型汇总表】中R表示拟合优度,值越接近1表示模型越好(但不能说他们之间不相关,可能是非线性相关),一元线性回归里,相关系数平方就是R方。方差分析F检验—变量之间是否有线性关系【Anova表】表示分析结果,主要看的是F和Sig值,F值对应的Sig值小于0.05就可以认为回归方程是有用的回归系数t检验—回归方程的系数是否显著【系数表】sig均小于0.05表示自变量对因变量有

Python连接SQL与hive

--ZstarlingSQL连接hive连接补充写入方法write与writelines对比表格Dataframe形式的写入for、with 位置对比SQL连接import pymysqldef sql(path):conn = pymysql.Connect(host='36.104.34.123', user='用户名', passwd='密码', db='库名')# 获取游标cursor =

#hive#sql#python
Python写入EXCEL

pd.ExcelWriter写入open写入方法write与writelines对比表格Dataframe形式的写入for、with 位置对比

#python#开发语言#机器学习
到底了