下载此文档

统计分析-聚类分析.ppt


文档分类:高等教育 | 页数:约54页 举报非法文档有奖
1/54
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/54 下载此文档
文档列表 文档介绍
2021
统计分析-聚类分析
主要分类
R型聚类分析
对变量进行聚类分析(比较:主成分、公因子)
Q型聚类分析的距离
类平均距离
设类Gp与类Gq中任意两个元素之间距离的平均值为Gp与类Gq之间的距离
§ 统计量
系统聚类
先将每样本(变量)看成一类,然后定义样本(变量)间的
距离(或相似系数,在SPSS软件中把相似系数也看成是一种距
离系数)和类与类间的距离。
选择距离最小的两类将其合并成一新类,再按类间距离的定义
计算新类与其它类的距离,再行合并,直至所有样本都聚为一类
为止。
根据一定的标准确定类的个数。
§ 系统聚类
聚类方法
①“Between-groups linkage”类间平均法,当两类之间所有样本之间距离的平均值最小时,这两类可以合并为一类。
②“Within- groups linkage”类内平均法,当合并后所有样本的距离的平均值最小时,这两类可以合并为一类。
③“Nearest neighbor”最短距离法,当两类最近样本之间的距离最小时,这两类可以合并为一类。
④“Furthest neighbor”最长距离法,当两类最远样本之间的距离最小时,这两类可以合并为一类。
⑤“Centroid clustering”重心法,当两类重心距离最小时,这两类可以合并为一类。
⑥“Median clustering”中心法,当两类中心距离最小时,这两类可以合并为一类。
⑦ “Ward‘s method”离差平方和法,当合并后类内部各个样本距离(欧氏距离)的离差平方和最小时,这两类可合并为一类。
§ 系统聚类
聚类方法
§ 系统聚类
类的个数的确定
根据谱系图确定分类个数的准则:
各类间的距离必须较大;
类中包含的元素不要太多;
类的个数必须符合实际应用;
如果采用几种不同的聚类方
法处理,则在各种聚类图中应
该发现相同的类。
§ 系统聚类法
SPSS 软件实现
§ 系统聚类法
选择对变量进行聚类
SPSS 软件实现
§ 系统聚类法
对原始数据进行离差标准化处理;
采用相关系数表征变量之间的相似程度;
采用离差平方和最小的方法计算类与类之间的距离。
SPSS 软件实现
结果分析-数据信息
§ 系统聚类法
SPSS 软件实现
结果分析-相关系数矩阵
§ 系统聚类法
SPSS 软件实现
结果分析-聚类凝聚过程表
§ 系统聚类法
Stage 列出步骤序号,Cluster Combined 栏中列出了合
并的两个类的序号,Next stage栏是合并的新类再次出
现的步骤序号。
SPSS 软件实现
结果分析-“Icicle” 冰柱图
§ 系统聚类法
SPSS 软件实现
对样本进行聚类
数据标准化方法:离差标准化(Z score法)
点与点间距离的计算:欧氏距离
类与类间距离的计算:“Ward's method”离差平方和法
§ 系统聚类法
SPSS 软件实现
对样本进行聚类
§ 系统聚类法
SPSS 软件实现
对样本进行主成分聚类
主成分提取方法:累积方差贡献率>85% (第八章分析结果)
数据标准化方法:离差标准化(Z score法)
点与点间距离的计算:欧氏距离
类与类间距离的计算:“Ward's method”离差平方和法
§ 系统聚类法
SPSS 软件实现
§ 系统聚类法
SPSS 软件实现
对样本进行因子聚类
因子提取方法:主成分法、累积方差贡献率>85% 、方差最大正交因子旋转
数据标准化方法:离差标准化(Z score法)
点与点间距离的计算:欧氏距离
类与类间距离的计算:“Ward's method”离差平方和法
§ 系统聚类法
SPSS 软件实现
对样本进行因子聚类
§ 系统聚类法
SPSS 软件实现
§ 系统聚类法
CLU3-1是全变量聚类结果;CLU3-2是主成分聚类结果;CLU3-2是因子聚类结果
SPSS 软件实现
§ 系统聚类法
Friedman检验表明:全变量聚类结果、主成分聚类
结果、因子聚类结果存在显著性差异
Wilcoxom检验表明:全变量聚类结果与主成分聚类结果、
因子聚类结果存在显著性差异,但主成分与因子聚类结果
无显著性差异。
快速聚类分析的基本思想
在快速聚类过程中,参与聚类分析的变量必须是数值型变量,分

统计分析-聚类分析 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数54
  • 收藏数0 收藏
  • 顶次数0
  • 上传人放射辐射
  • 文件大小819 KB
  • 时间2022-04-25