杰瑞科技汇

因子分析如何操作?

SPSS因子分析完整教程

第一部分:理论基础——什么是因子分析?

在开始操作前,理解其核心思想至关重要。

因子分析如何操作?-图1
(图片来源网络,侵删)

核心目标 因子分析是一种数据降维结构探测的多元统计方法,它的主要目的是:

  • 降维:将众多存在相关性的原始变量(20个关于“工作满意度”的问卷题目),浓缩成少数几个相互独立的、无法直接观测的潜在变量,即“因子”(Factors),这些因子能够解释原始变量的大部分信息。
  • 结构探测:探索变量之间的内在结构,找出哪些变量在哪些因子上有高载荷,从而理解这些潜在因子的实际含义。

核心比喻 想象一下,你有很多个关于“汽车评价”的变量:油耗、加速性能、最高时速、操控性、价格、品牌声誉等。

  • 原始变量:油耗、加速、价格等。
  • 潜在因子:你可能发现“油耗”、“加速”、“最高时速”这些变量高度相关,它们共同反映了汽车的“性能”这个潜在因子,而“价格”、“品牌声誉”则可能反映了“档次”这个潜在因子。 因子分析就是帮你发现这种“性能”和“档次”这样的潜在因子。

适用场景

  • 心理学:将多个问卷题目浓缩成少数几个“构念”(如:焦虑、幸福感、外向性)。
  • 市场营销:将消费者对产品的多个评价(如:价格、质量、设计、服务)浓缩成几个关键维度(如:性价比、品牌形象)。
  • 社会学:将多个社会态度问题浓缩成几个核心价值观。
  • 金融:分析众多股票数据,找出影响它们表现的几个“市场因子”或“行业因子”。

第二部分:操作步骤——以SPSS为例

我们将通过一个实例,一步步学习如何在SPSS中进行因子分析。

因子分析如何操作?-图2
(图片来源网络,侵删)

研究案例:一位研究者想了解影响员工工作满意度的潜在因素,他设计了15个相关问题,每个问题都用1-5分(1=非常不同意,5=非常同意)来衡量,他需要对这15个问题进行因子分析,找出背后的几个核心维度。


步骤1:数据准备与变量定义

  1. 打开SPSS,将你的数据导入或输入到数据视图中。
  2. 切换到变量视图,为每个变量定义清晰的名称和标签。
    • 名称:简短的英文或拼音,如 Q1, Q2, ..., Q15
    • 对变量的详细说明,如“我的薪水很公平”、“我的工作内容很有趣”等,这会让结果更易读。
    • 类型:确保所有分析变量都是数值型

步骤2:因子分析设置

  1. 点击菜单栏:分析 -> 降维 -> 因子...
  2. 在弹出的“因子分析”对话框中:
    • 将你想要分析的15个变量(Q1Q15)从左侧列表移到右侧的变量框中。

步骤3:描述性统计

  1. 在主对话框中,点击 描述... 按钮。
  2. 在“因子分析:描述统计”对话框中:
    • 勾选 KMO和Bartlett的球形度检验,这是必须要做的检验,用于判断数据是否适合做因子分析。
    • 原始分析结果:默认勾选即可,它会显示变量的共同度。
    • 点击 继续

步骤4:因子提取方法

  1. 在主对话框中,点击 提取... 按钮,这是因子分析最核心的一步。
  2. 在“因子分析:提取”对话框中:
    • 方法:通常选择 主成分分析,这是最常用、最基础的方法,如果你的理论假设变量间存在共同方差,也可以选择主轴因子法
    • 分析:选择 相关性矩阵(默认)。
    • 提取
      • 基于特征值:最常用的标准,通常选择 大于1,这意味着只保留特征值大于1的因子,特征值可以理解为每个因子所能解释的原始变量的信息量。
      • 因子数量:也可以手动指定要提取的因子数量,但通常建议先基于特征值大于1来初步判断。
    • 输出
      • 勾选 未旋转的因子解
      • 勾选 碎石图,这个图可以帮助你判断提取多少个因子比较合适(寻找曲线的“拐点”)。
    • 最大收敛性迭代次数:默认25即可。
    • 点击 继续

步骤5:因子旋转

  1. 在主对话框中,点击 旋转... 按钮。
  2. 为什么需要旋转? 初始的因子解(未旋转)可能难以解释,因为一个变量可能在多个因子上都有载荷,旋转的目的是简化因子结构,让每个变量只在少数因子上有高载荷,从而更容易解释因子的实际意义。
  3. 在“因子分析:旋转”对话框中:
    • 方法
      • 最大方差法:最常用、最推荐的旋转方法,它试图使每个因子上的载荷差异最大化,便于解释。
      • 直接 ObliminPromax:当你假设因子之间存在相关性时使用,大多数情况下,先尝试最大方差法
    • 显示:勾选 旋转解
    • 输出:勾选 载荷图,可以直观地看到变量与因子的关系。
    • 点击 继续

步骤6:因子得分

  1. 在主对话框中,点击 得分... 按钮。
  2. 在“因子分析:因子得分”对话框中:
    • 勾选 另存为变量,SPSS会为每个提取出的因子生成一个新的变量(如 FAC1_1, FAC2_1),代表每个样本在每个因子上的得分,这些得分可以用于后续的回归分析等。
    • 方法
      • 回归:最常用的方法,产生的分数均值为0,标准差为1。
      • Bartlett:分数均值为0。
    • 显示因子得分系数矩阵:可以查看计算因子得分的系数。
    • 点击 继续

步骤7:选项

  1. 在主对话框中,点击 选项... 按钮。
  2. 在“因子分析:选项”对话框中:
    • 系数显示格式
      • 勾选 按大小排序:让因子载荷按绝对值大小降序排列,方便查看。
      • 勾选 取消小系数:在输出中隐藏绝对值小于某个值(如0.4)的载荷,使结果更清晰,这个值可以根据你的研究调整,0.3或0.4是常见阈值。
    • 点击 继续,然后点击 确定,开始运行分析。

第三部分:结果解读

SPSS输出结果很多,我们需要重点关注以下几个部分。

KMO和Bartlett检验

  • KMO (Kaiser-Meyer-Olkin) 测度
    • 作用:检验变量间的相关性是否足够强,判断数据是否适合做因子分析。
    • 解读:值在0到1之间。> 0.9 表示极好;> 0.8 表示良好;> 0.7 表示中等;> 0.6 表示勉强可接受;< 0.5 表示不合适。
  • Bartlett的球形度检验
    • 作用:检验相关系数矩阵是否为单位阵(即变量间是否独立)。
    • 解读:看显著性Sig. < 0.05,则拒绝原假设(变量间独立),说明变量间存在相关性,适合做因子分析。

如果KMO > 0.6 且 Bartlett检验Sig. < 0.05,则可以继续进行因子分析。

总方差解释

这个表格告诉你提取出的每个因子有多大的“威力”。

因子分析如何操作?-图3
(图片来源网络,侵删)
  • 初始特征值
    • 总计:就是每个因子的特征值,我们提取的是特征值>1的因子。
    • 方差百分比:每个因子解释的原始变量总方差的百分比。
    • 累积百分比:所有提取出的因子共同解释的总方差百分比。
  • 旋转后平方和载入

    这个表格是经过旋转后的结果,旋转不会改变每个因子的总解释力(累积百分比不变),但会重新分配每个因子对原始变量的解释方差,使得每个因子的意义更清晰。

提取了3个因子,它们共同解释了总方差的65%,说明这3个因子能够很好地代表原始15个变量的信息。

成分矩阵 / 旋转后的成分矩阵

这是解读因子含义的核心表格。

  • 成分矩阵:是未旋转的因子载荷矩阵,通常比较乱。
  • 旋转后的成分矩阵:是我们需要重点看的,它显示了每个原始变量在各个因子上的因子载荷

如何解读因子载荷?

  • 因子载荷的绝对值越大(通常以 ±0.4±0.5 为界),说明该变量与这个因子的关系越强。
  • 正载荷:正相关。“薪水公平”在“薪酬”因子上有正载荷,意味着认为薪水公平的人,对该因子的得分也高。
  • 负载荷:负相关。

如何给因子命名?

  1. 找出每个因子上载荷高(如 > 0.5)的变量
  2. 分析这些变量的共同主题,它们共同测量了什么概念?
  3. 为这个因子起一个概括性的名字

示例解读: 假设旋转后的矩阵如下:

变量 因子1 因子2 因子3
Q1 薪水公平 .85 .10 .05
Q2 福利待遇 .82 .15 .08
Q3 奖金激励 .78 .20 .12
Q4 工作自主性 .10 .88 .05
Q5 工作挑战性 .15 .85 .10
Q6 能力发挥 .05 .80 .20
Q7 同事关系 .05 .10 .92
Q8 上级支持 .10 .15 .90
  • 因子1Q1, Q2, Q3 载荷很高,都与“钱”有关,可以命名为 “薪酬福利”
  • 因子2Q4, Q5, Q6 载荷很高,都与“工作内容”本身有关,可以命名为 “工作本身”
  • 因子3Q7, Q8 载荷很高,都与“人际关系”有关,可以命名为 “人际关系”

通过这种方式,你就将15个原始问题成功归纳为了3个有意义的潜在维度。

碎石图

  • 作用:辅助判断提取多少个因子。
  • 解读:横轴是因子编号,纵轴是特征值,寻找曲线的“拐点”(陡坡变缓的点),在拐点之前,是应该提取的“大石块”(重要因子),拐点之后的是“碎石”(不重要的因子)。

示例解读: 假设图中第1、2、3个因子特征值很高,从第4个因子开始曲线变得平缓,那么结合“特征值大于1”的标准,提取3个因子是合理的。


第四部分:常见问题与注意事项

  1. 因子提取数量:“特征值大于1”只是一个经验法则,有时会提取过多或过少的因子,需要结合碎石图理论合理性因子解释的清晰度来综合判断。
  2. 因子命名:这是最主观的一步,命名要有理论依据,不能凭空想象,如果某个因子上的所有高载荷变量都无法用一个合理的概念来解释,可能需要重新审视你的分析过程(如是否需要调整旋转方法或删除某些变量)。
  3. 交叉载荷:如果一个变量在两个或多个因子上的载荷都很高(例如都>0.5),这被称为交叉载荷,会给解释带来困难,可以考虑删除该变量,或者尝试使用不同的旋转方法。
  4. 共同度:在“描述性统计”中输出的“初始”共同度,表示该变量能被所有提取的因子共同解释的比例,如果某个变量的共同度很低(如<0.4),说明它与其他变量的共同信息很少,可以考虑从分析中剔除。
  5. 样本量:因子分析对样本量有一定要求,一般建议样本量至少是变量数的5-10倍,且总样本量不应少于100。

因子分析是一个强大的工具,但它的成功不仅依赖于SPSS的操作,更依赖于研究者对数据的理解和理论知识,记住这个流程:

准备数据 -> 运行分析 -> 检验前提 -> 提取因子 -> 旋转因子 -> 解释因子 -> 命名因子 -> 应用结果

希望这份详细的教程能让你对SPSS因子分析有一个全面而深入的理解!祝你学习顺利!

分享:
扫描分享到社交APP
上一篇
下一篇