话本小说网 > 都市小说 > 学无止境!
本书标签: 都市  又是秃头的一天  沉迷学习 

主成分&聚类分析习题

学无止境!

16.某地区35个城市2004年的7项经济统计指标数据见下表。

(一)试用最短距离聚类法对35个城市综合实力进行系统聚类分析,并画出聚类谱系图。

(1)步骤:

①分析——分类——系统聚类

②将城市编号的类型改为字符串,不然个案那里导不进去。

③将城市编号导入个案,其他变量导入变量。

④统计选项选合并进程表和无。

⑤绘图勾选谱系图、所有聚类和垂直。

⑥最短距离法改标准化那,选范围-1至1。

(2)结果

①个案处理摘要

②凝聚计划(部分截图)

③个案

④谱系图

(2)分析结果

聚类距离不同,聚类结果就不同。当距离为0时,每个样本为单独的一类,一共有35类;距离为5,就有11类;距离为10,就有7类,以此类推,当距离为25时,只有1类。

(二)试用主成分分析法对35个城市7项经济指标进行主成分分析,并分析其综合实力。

(1)操作步骤

①分析-降维-因子分析,导入变量。

②描述里Statistics全选,相关性矩阵中勾选系数、显著性水平、反映象、KMO和巴特利特检验。

③抽取中方法选主成分,分析勾选相关性矩阵,输出全部勾选,抽取选基于特征值。

④方法选最大方差法,输出全部勾选。

⑤得分选回归,勾选显示因子得分系数矩阵。

(2)分析数据

①相关系数矩阵

分析:

表格的上半部分是相关系数,相关系数为负数就表示两个变量是负相关,正数则表示两变量成正相关。

表格的下半部分是显著性水平(即P值),和0.05作比较,小于0.05则说明两个变量是显著性相关。

②KMO和巴特利特检验

分析:

KMO检验可以检验变量之间的偏相关性,范围在0~1之间,越接近1说明偏相关性越好,因子分析效果越好。

>0.6,有效性可以接受。

>0.8,有效性非常好。

③反映像矩阵

分析:

只看相关性矩阵部分的对角线,如0.623a是KMO系数,>0.6 则说明有效性有所欠缺。

④总方差解释

分析:

从>1的特征值来筛选,一共有2个。这两个主成分总共解释了总方差的88%以上。

⑤碎石图

分析:

和上面的总方差解释结合来看,重点看拐点,从图可知2是一个拐点,从而得知我们选择公因子为2没有问题。

⑥成分矩阵

分析:

主成分分析法提取了2个主成分出来,此表展现了它们的分布情况,包含了提取后各个主成分和变量之间的所有相关系数,如0.827>0.374,表明总人口属于第二主成分。

⑦载荷图

分析:

是一个二维图,辅助成分矩阵来看,靠的近的变量可能属于同一主成分。

⑧成分得分系数矩阵

分析:

可以看出旋转后的得分情况,如果因子载荷≥0.3则是显著相关的关系,再根据这个标准给每个因子归类。

总结论:

第一个主成分包括工业总产值、地方财政预测内收入、城乡居民储蓄余额、在岗职工总额,第二个主成分包括非农业人口比例、农业总产值,达到了降维目的。

(三)以第一、二、三主成分为变量,进行聚类分析,结果又怎样呢?

(1)操作步骤

①因为只有2个变量,不符合题目要求。

②所以要再提取因子,其他步骤和主成分分析一样,就不放截图了。

③再采用聚类分析。

④将3个主成分导入变量。

⑤统计中勾选合并进程表、近似值矩阵,聚类成员选无。

⑥绘图中勾选谱系图,分类选所有聚类,方向选垂直。

⑦重点是标准化处理,选Z分数。

(2)结果

①个案处理摘要

②非相似性矩阵太大了,不好截图,总之它是将每个样本当成一个个案,计算相似度。

③凝聚计划(看每一组是如何合并到一起的)

④个案

分析:取个数为10,则可分为12类。

⑤谱系图(和个案结合着)

上一章 八、趋势面分析(ArcMap) 学无止境!最新章节 下一章 学校教育学资料(二分之一)