相对重要性分析

各个系数大小是不能被用来直接比较的。
逐步回归法:回归中逐步引入解释变量以及显著性测试。
重要性分析 (Dominance Analysis) :确定线性回归中,不同解释变量对决定系数 R2的贡献程度。
stata domin 命令

ssc intsall domin,replace //安装
domin depvar indepvars [if] [in] [weight],sets((varlist) (varlist) ...)

depvar:因变量
indepvars:解释变量
sets((varlist)(varlist)) 设定会将被列入 varlist 的变量视作一个解释变量。例如 sets((x1 x2)(x3 x4)) 表示会创建 2 个变量集合 (set)。其中 set1 由变量 x1 和变量 x2 创立,而 set2 则由变量 x3 和变量 x4 创立。该命令通常由于进行分组分析。
举例:

//用 Stata 自带的范例数据 auto.dta 来演示
sysuse "auto.dta", clear
pwcorr price weight length   //相关系数
reg price weight length 
domin price weight length //结果如下图

在这里插入图片描述在这里插入图片描述
Overall Fit Statistic 的数值与运行 reg命令后的 R-squared 数值相同。这是因为 domin 命令默认的拟合优度统计量即为 R-squared.

变量 weight 对拟合优度 的边际贡献为0.2256。

变量 length对拟合优度 的边际贡献为 0.1220。

在该线性回归中,变量 weight 相对于变量 length 更加重要,对被解释变量 price 的方差的变化的解释力度更强。

//多变量
sysuse "nlsw88.dta", clear
reg wage age hours tenure married
domin wage age hours tenure married
//分组分析
domin wage age hours tenure married,   ///
	 sets((i.occupation) (i.industry) (i.race))

在这里插入图片描述
在这里插入图片描述
在处理中将 set1,set2,set3 分别视作由 occupation ,industry 和 race产生的三个解释变量。
set1 > set2 > tenure > hours > set3 > married > age

Logo

为开发者提供自动驾驶技术分享交流、实践成长、工具资源等,帮助开发者快速掌握自动驾驶技术。

更多推荐