数据请关注公众号:321红绿灯回复:例5-3

即可获取

在这里插入图片描述
题目来自何晓群《多元统计分析》(第五版)例题5-3

实验内容

试利用主成分综合评价全国各地区水泥制造业规模以上企业的经济效益,原始数据来
源于2014 年《中国水泥统计年鉴》,如表5一5所示。

实验目的

掌握主成分分析的使用方法,提取主成分,计算主成分得分及综合得分。

实验过程

一、标准化数据
在这里插入图片描述
在这里插入图片描述
如图是局部标准化数据
标准化数据局部
二、提取主成分

操作过程

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结果分析:

一、标准化数据

二、提取主成分
利用spss【分析-降维-因子分析】可以进行主成分的提取。输出相关矩阵表、公因子方差表及解释的总方差表和成分矩阵表、成分得分的系数矩阵。从样本相关矩阵中可以看到8个变量中都存在着较强的线性相关,因此适合进行主成分分析。

在这里插入图片描述
在这里插入图片描述
公因子方差图给出了在构造主成分时从各个变量中提取的变量的百分比,即构成主成分时的变量。
在这里插入图片描述
第三个表是解释的总方差表,给出了对应的特征根及主成分之间的方差贡献率和累积贡献率,从累积贡献率中可以看出,当提取了两个主成分时,累积方差贡献率为91.036%,因此已经涵盖了大多数变量的信息,所以只构造两个主成分。由原来的7个变量转化为两个综合变量,起到了降维的目的。
在这里插入图片描述
成分得分系数矩阵用于计算公共因子的得分,两者综合后得到权重,表示了各项指标和提取的公因子之间的关系,某一因子上得分越高,与公因子之间的关系越密切,即变量和主成分之间的关系越密切,在主成分1中,得分最高的是X5,最低的是X7,在主成分2中,得分最高的是X7,最低的是X4。因此,主营业务收入(X5)与主成分1的关系最密切,销售利润率与主成分2的关系最密切,与主成分1之间的关系最不密切。负额总额(X4)与主成分2之间的关系最不紧密。
在这里插入图片描述
通过成分矩阵,可以计算得到标准化后原始变量的变换系数,从而得到对于第一主成分的各标准化向量的线性组合和对于第二主成分各标准化向量的线性组合。
在这里插入图片描述
三、构造主成分载荷矩阵表
通过SPSS中的【转换-计算变量】可以得到Y1和Y2,即构成主成分载荷的矩阵表,得到主成分Y1、Y2的变换系数。
在这里插入图片描述
计算得到变换系数表后可以得到主成分的方程表达式

四、获得主成分表达式

可以获得第一主成分和第二主成分的方程表达式分别是:
在这里插入图片描述
方程表达式中的各变量均为标准化后的变量,水泥生产的经济意义指标由系数较大的几个变量决定,除了销售利润率外,其他指标的大小相当,所以主成分Y1反应了水泥企业的整体规模和收入水平。在主成分Y2的表达式中,主要是企业规模和企业的盈利能力两方面进行刻画企业的经济效益,因此主成分Y1和Y2具有91.036%的可靠性。

五、各主成分评分
重复计算变量的操作,得到各地区第一主成分和第二主成分的成分得分
在这里插入图片描述
通过标准化的原始数据计算两个主成分的得分,对各地区进行分类。

六、综合主成分评分

还是通过转换变量得到主成分1和主成分2的综合得分,在综
合得分中有些地区的得分是负数,但这并不代表着经济效益为负,而是代表着与平均水平之间的关系,从碎石图可以看到聚类。但是由于没有地区标注,因此只能清晰的看出分成了两类但是看不出来是哪些地区互为一类。

在这里插入图片描述
试验总结:

通过本次试验,掌握了主成分分析的方法,对于数据量纲差异较大的样本要先进行标准化的处理,再进行主成分的提取,达到降维的目的。提取主成分过后,要根据解释总方差图中的合计项对应的主成分中的特征值,计算成分系数,得到主成分的方程表达式。然后,需要对主成分进行评分,通过转换变量,得到成分的系数评分和主成分的综合评分,最后进行分类。

Logo

助力广东及东莞地区开发者,代码托管、在线学习与竞赛、技术交流与分享、资源共享、职业发展,成为松山湖开发者首选的工作与学习平台

更多推荐