2021
统计分析-聚类分析
主要分类
R型聚类分析
对变量进行聚类分析(比较:主成分、公因子)
Q型聚类分析的距离
类平均距离
设类Gp与类Gq中任意两个元素之间距离的平均值为Gp与类Gq之间的距离
§ 统计量
系统聚类
先将每样本(变量)看成一类,然后定义样本(变量)间的
距离(或相似系数,在SPSS软件中把相似系数也看成是一种距
离系数)和类与类间的距离。
选择距离最小的两类将其合并成一新类,再按类间距离的定义
计算新类与其它类的距离,再行合并,直至所有样本都聚为一类
为止。
根据一定的标准确定类的个数。
§ 系统聚类
聚类方法
①“Between-groups linkage”类间平均法,当两类之间所有样本之间距离的平均值最小时,这两类可以合并为一类。
②“Within- groups linkage”类内平均法,当合并后所有样本的距离的平均值最小时,这两类可以合并为一类。
③“Nearest neighbor”最短距离法,当两类最近样本之间的距离最小时,这两类可以合并为一类。
④“Furthest neighbor”最长距离法,当两类最远样本之间的距离最小时,这两类可以合并为一类。
⑤“Centroid clustering”重心法,当两类重心距离最小时,这两类可以合并为一类。
⑥“Median clustering”中心法,当两类中心距离最小时,这两类可以合并为一类。
⑦ “Ward‘s method”离差平方和法,当合并后类内部各个样本距离(欧氏距离)的离差平方和最小时,这两类可合并为一类。
§ 系统聚类
聚类方法
§ 系统聚类
类的个数的确定
根据谱系图确定分类个数的准则:
各类间的距离必须较大;
类中包含的元素不要太多;
类的个数必须符合实际应用;
如果采用几种不同的聚类方
法处理,则在各种聚类图中应
该发现相同的类。
§ 系统聚类法
SPSS 软件实现
§ 系统聚类法
选择对变量进行聚类
SPSS 软件实现
§ 系统聚类法
对原始数据进行离差标准化处理;
采用相关系数表征变量之间的相似程度;
采用离差平方和最小的方法计算类与类之间的距离。
SPSS 软件实现
结果分析-数据信息
§ 系统聚类法
SPSS 软件实现
结果分析-相关系数矩阵
§ 系统聚类法
SPSS 软件实现
结果分析-聚类凝聚过程表
§ 系统聚类法
Stage 列出步骤序号,Cluster Combined 栏中列出了合
并的两个类的序号,Next stage栏是合并的新类再次出
现的步骤序号。
SPSS 软件实现
结果分析-“Icicle” 冰柱图
§ 系统聚类法
SPSS 软件实现
对样本进行聚类
数据标准化方法:离差标准化(Z score法)
点与点间距离的计算:欧氏距离
类与类间距离的计算:“Ward's method”离差平方和法
§ 系统聚类法
SPSS 软件实现
对样本进行聚类
§ 系统聚类法
SPSS 软件实现
对样本进行主成分聚类
主成分提取方法:累积方差贡献率>85% (第八章分析结果)
数据标准化方法:离差标准化(Z score法)
点与点间距离的计算:欧氏距离
类与类间距离的计算:“Ward's method”离差平方和法
§ 系统聚类法
SPSS 软件实现
§ 系统聚类法
SPSS 软件实现
对样本进行因子聚类
因子提取方法:主成分法、累积方差贡献率>85% 、方差最大正交因子旋转
数据标准化方法:离差标准化(Z score法)
点与点间距离的计算:欧氏距离
类与类间距离的计算:“Ward's method”离差平方和法
§ 系统聚类法
SPSS 软件实现
对样本进行因子聚类
§ 系统聚类法
SPSS 软件实现
§ 系统聚类法
CLU3-1是全变量聚类结果;CLU3-2是主成分聚类结果;CLU3-2是因子聚类结果
SPSS 软件实现
§ 系统聚类法
Friedman检验表明:全变量聚类结果、主成分聚类
结果、因子聚类结果存在显著性差异
Wilcoxom检验表明:全变量聚类结果与主成分聚类结果、
因子聚类结果存在显著性差异,但主成分与因子聚类结果
无显著性差异。
快速聚类分析的基本思想
在快速聚类过程中,参与聚类分析的变量必须是数值型变量,分
统计分析-聚类分析 来自淘豆网www.taodocs.com转载请标明出处.