视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
因子分析法--综合评价指标
2025-09-29 02:17:57 责编:小OO
文档
《应用统计分析》----题目2

题目2 数据data2是某医院3年中各月的数据,包括门诊人次、出院人数、病床利用率和周转次数、平均住院天数、治愈或好转率、病死率、诊断符合率、抢救成功率。采用因子分析法探讨综合评价指标。

一、因子分析法

因子分析是主成分分析的推广和发展,也是利用降维方法进行统计分析的一种多元统计方法。它是一种将多变量化简的技术,其目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性则降低。每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。

因子分析有一个默认的前提条件就是各变量间必须有相关性,否则,各变量间没有共享信息,就不应当有公因子需要提取,自然也谈不上使用该方法。具体在该条件的判断上,除了根据专业知识来估计外,还可以使用KMO统计量和Bartlett’s 球形检验加以判定。

二、操作步骤

1.导入数据

依次单击“文件—打开—数据文件”命令,打开如图1所示的对话框。

图1 导入数据

2.因子分析

(1)依次单击“分析—降维—因子分析”命令,如图2所示。打开图3所示的“因子分析”主对话框。

图2 因子分析菜单

(a)选入变量前

(b)选入变量后

图3 “因子分析”主对话框

(2)在图3(a)所示的对话框中选中左边的变量,单击  按钮,将其选入到左边的列表框中(如图3a所示)。

(3)单击“描述”按钮,弹出“因子分析:描述统计”对话框,如图4所示,在“统计量”选项组中选取“原始分析结果”;在“相关矩阵”中选取“系数”和“KMO和Bartlett”。设置完毕后,单击“继续”按钮,确认操作。

图4 “因子分析:描述”对话框            

图5 “因子分析:抽取”对话框

(4)单击“抽取”按钮,得到如图5所示的“因子分析:抽取”对话框。选择“方法”为“主成分”;在“分析”选项组选择“相关性矩阵”;在“输出”选项组选择“未旋转的因子解”和“碎石图”;在“提取”选项组中将“因子的固定数量:”设置为4;将“最大收敛性迭代次数:”设置为25.

(5)单击“旋转”按钮,得到如图6所示的“因子分析:旋转”对话框。在“方法”选项组选择“最大四次方值法”;在“输出”选项组选择“旋转解”;将“最大收敛性迭代次数:”设置为25。

(6)单击“得分”按钮,得到如图7所示的“因子分析:得分”对话框。选择“保存为新变量”和“显示因子得分系数矩阵”;在“方法”选项组选择“回归”。

最后,在“因子分析”主对话框(如图3所示)中,单击“确定”按钮,执行操作。

图6 “因子分析:旋转”对话框

图7 “因子分析:因子得分”对话框

3.结果解释

(1)相关性分析

表1 相关矩阵

相关矩阵
门诊人次出院人数病床利用率病床周转数平均住院天数治愈好转率病死率诊断符合率抢救成功率
相关门诊人次1.000.044.283.288.326-.118-.024.347-.425
出院人数.0441.000.084.572-.420.132-.210-.343.505
病床利用率.283.0841.000.678-.110-.038-.123.129-.088
病床周转数.288.572.6781.000-.412-.055-.297-.202.235
平均住院天数.326-.420-.110-.4121.000.297.093.416-.418
治愈好转率-.118.132-.038-.055.2971.000-.380-.068.007
病死率-.024-.210-.123-.297.093-.3801.000.079-.284
诊断符合率.347-.343.129-.202.416-.068.0791.000-.449
抢救成功率-.425.505-.088.235-.418.007-.284-.4491.000
表2 KMO和Bartlett的检验

KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin 度量。

.490
Bartlett 的球形度检验

近似卡方119.028
df36
Sig..000
通过相关矩阵发现,大部分系数均超过0.3,另外通过Bartlett检验可以看出,应拒绝各变量的假设。不过KMO统计量为0.490,小于0.7,说明变量间的信息重叠度可能不是特别的高,有可能做出的因子分析模型不是非常完善,不过值得尝试。

(2)主成分信息

表3 主成分信息

解释的总方差
成份初始特征值提取平方和载入旋转平方和载入
合计方差的 %

累积 %

合计方差的 %

累积 %

合计方差的 %

累积 %

12.80731.19431.1942.80731.19431.1942.62829.20129.201
21.99122.12453.3171.99122.12453.3171.85420.60349.804
31.44816.09269.4101.44816.09269.4101.47116.33966.144
4.7858.72378.133.7858.72378.1331.07911.978.133
5.6817.56385.696
6.5416.01491.710
7.4535.03496.744
8.1751.93998.683
9.1191.317100.000
提取方法:主成份分析。
表1中的前三个主成分的特征值大于1,但是它们的累积贡献率仅为69.410%。

(3)变量的共同度

表4 变量的共同度

公因子方差
初始提取
门诊人次1.000.879
出院人数1.000.870
病床利用率1.000.866
病床周转数1.000.917
平均住院天数1.000.770
治愈好转率1.000.796
病死率1.000.6
诊断符合率1.000.565
抢救成功率1.000.681
提取方法:主成份分析。

图8 碎石图

表2显示,每一个变量的公因子方差均在0.5以上,且大多数接近或超过0.7,这说明4个公因子能够较好地反映客观原变量的大部分信息。另外,从碎石图可以看出因子1、2、3、4之间的连线比较陡峭,说明特征值的差值较大,前四个因子比较重要。这和上表的结果是吻合的。

(4)旋转前的因子负荷矩阵(如表3所示)

表5 旋转前的因子负荷矩阵

成份矩阵a

成份
1234
门诊人次-.255.770.008.470
出院人数.766.128.091.508
病床利用率.244.776-.086-.443
病床周转数.6.661-.071-.020
平均住院天数-.724.125.440.1
治愈好转率.039-.071.888-.009
病死率-.405-.1-.663.243
诊断符合率-.623.402.041-.116
抢救成功率.737-.366.059.021
提取方法 :主成分分析法。

a. 已提取了 4 个成份。

根据0.5原则,因子1在多数原始变量上有较大的负荷,因子2在x1(门诊人次)、x3(病床利用率)和x4(病床周转数)变量上有较大负荷,因子3在x6(治愈好转率)、x7(病死率)变量上有较大的负荷,因子4在x2(出院人数)变量上有较大负荷。因此说明,除可初步认定因子1反映综合情况、因子3反映医疗水平情况外,其他两个因子的意义不明显。

(5)正交旋转矩阵(如表4所示)

表6 正交旋转矩阵

成份转换矩阵
成份1234
1-.8.395.153.117
2.410.783.027.466
3.115-.140.980.077
4-.109-.459-.122.873
提取方法 :主成分分析法。  

 旋转法 :具有 Kaiser 标准化的四分旋转法。 

这是通过四次方最大旋转得到的正交变换矩阵。

(6)旋转后的因子负荷矩阵(如表5所示)

表7 旋转后的因子负荷矩阵

旋转成份矩阵a

成份
1234
门诊人次.494.286-.068.740
出院人数-.680.157.147.601
病床利用率.137.920.028-.003
病床周转数-.354.809.056.366
平均住院天数.732-.337.301.173
治愈好转率.039-.160.876.033
病死率.193-.307-.746.037
诊断符合率.742.116-.030.016
抢救成功率-.808-.013.158-.061
提取方法 :主成分分析法。 

 旋转法 :具有 Kaiser 标准化的四分旋转法。

a. 旋转在 5 次迭代后收敛。

结果显示,因子1支配的变量有x1(门诊人数)、x2(出院人数)、x5(平均住院天数)、x8(诊断符合率)和x9(抢救成功率),因子2支配的变量有x3(病床利用率)和x4(病床周转数),因子3支配的变量有x6(治愈好转率)和x7(病死率),因子4支配的变量有x1(门诊人数)和x2(出院人数)。故可以认为,因子1反应医院医疗工作质量各方面的情况,称为综合因子,因子2反应病床利用情况,称为病床利用因子,因子3反应医疗水平,称为水平因子,因子4反应就诊病人数量,称为数量因子。与旋转前的因子负荷矩阵相比较,说明该旋转对因子负荷起到了明显的分离作用,使各因子具有较明显的专业意义。

通过探索性因子分析,从这9个变量中找到了4个潜在因子,它们是:综合因子、病床利用因子、水平因子和数量因子,如下表所示。

因子高负荷指标因子名称
因子一x1(门诊人数)

综合因子
x2(出院人数)

x5(平均住院天数)

x8(诊断符合率)

x9(抢救成功率)

因子二x3(病床利用率)

病床利用因子
x4(病床周转数)

因子三x6(治愈好转率)

水平因子
x7(病死率)

因子四x1(门诊人数)

数量因子
x2(出院人数)

That’s all! Thank you!

Thanks for your attention!下载本文

显示全文
专题