SPSS因子分析完整教程
第一部分:理论基础——什么是因子分析?
在开始操作前,理解其核心思想至关重要。

核心目标 因子分析是一种数据降维和结构探测的多元统计方法,它的主要目的是:
- 降维:将众多存在相关性的原始变量(20个关于“工作满意度”的问卷题目),浓缩成少数几个相互独立的、无法直接观测的潜在变量,即“因子”(Factors),这些因子能够解释原始变量的大部分信息。
- 结构探测:探索变量之间的内在结构,找出哪些变量在哪些因子上有高载荷,从而理解这些潜在因子的实际含义。
核心比喻 想象一下,你有很多个关于“汽车评价”的变量:油耗、加速性能、最高时速、操控性、价格、品牌声誉等。
- 原始变量:油耗、加速、价格等。
- 潜在因子:你可能发现“油耗”、“加速”、“最高时速”这些变量高度相关,它们共同反映了汽车的“性能”这个潜在因子,而“价格”、“品牌声誉”则可能反映了“档次”这个潜在因子。 因子分析就是帮你发现这种“性能”和“档次”这样的潜在因子。
适用场景
- 心理学:将多个问卷题目浓缩成少数几个“构念”(如:焦虑、幸福感、外向性)。
- 市场营销:将消费者对产品的多个评价(如:价格、质量、设计、服务)浓缩成几个关键维度(如:性价比、品牌形象)。
- 社会学:将多个社会态度问题浓缩成几个核心价值观。
- 金融:分析众多股票数据,找出影响它们表现的几个“市场因子”或“行业因子”。
第二部分:操作步骤——以SPSS为例
我们将通过一个实例,一步步学习如何在SPSS中进行因子分析。

研究案例:一位研究者想了解影响员工工作满意度的潜在因素,他设计了15个相关问题,每个问题都用1-5分(1=非常不同意,5=非常同意)来衡量,他需要对这15个问题进行因子分析,找出背后的几个核心维度。
步骤1:数据准备与变量定义
- 打开SPSS,将你的数据导入或输入到数据视图中。
- 切换到变量视图,为每个变量定义清晰的名称和标签。
- 名称:简短的英文或拼音,如
Q1,Q2, ...,Q15。 - 对变量的详细说明,如“我的薪水很公平”、“我的工作内容很有趣”等,这会让结果更易读。
- 类型:确保所有分析变量都是数值型。
- 名称:简短的英文或拼音,如
步骤2:因子分析设置
- 点击菜单栏:
分析->降维->因子...。 - 在弹出的“因子分析”对话框中:
- 将你想要分析的15个变量(
Q1到Q15)从左侧列表移到右侧的变量框中。
- 将你想要分析的15个变量(
步骤3:描述性统计
- 在主对话框中,点击
描述...按钮。 - 在“因子分析:描述统计”对话框中:
- 勾选
KMO和Bartlett的球形度检验,这是必须要做的检验,用于判断数据是否适合做因子分析。 原始分析结果:默认勾选即可,它会显示变量的共同度。- 点击
继续。
- 勾选
步骤4:因子提取方法
- 在主对话框中,点击
提取...按钮,这是因子分析最核心的一步。 - 在“因子分析:提取”对话框中:
- 方法:通常选择
主成分分析,这是最常用、最基础的方法,如果你的理论假设变量间存在共同方差,也可以选择主轴因子法。 - 分析:选择
相关性矩阵(默认)。 - 提取:
- 基于特征值:最常用的标准,通常选择
大于1,这意味着只保留特征值大于1的因子,特征值可以理解为每个因子所能解释的原始变量的信息量。 - 因子数量:也可以手动指定要提取的因子数量,但通常建议先基于特征值大于1来初步判断。
- 基于特征值:最常用的标准,通常选择
- 输出:
- 勾选
未旋转的因子解。 - 勾选
碎石图,这个图可以帮助你判断提取多少个因子比较合适(寻找曲线的“拐点”)。
- 勾选
- 最大收敛性迭代次数:默认25即可。
- 点击
继续。
- 方法:通常选择
步骤5:因子旋转
- 在主对话框中,点击
旋转...按钮。 - 为什么需要旋转? 初始的因子解(未旋转)可能难以解释,因为一个变量可能在多个因子上都有载荷,旋转的目的是简化因子结构,让每个变量只在少数因子上有高载荷,从而更容易解释因子的实际意义。
- 在“因子分析:旋转”对话框中:
- 方法:
最大方差法:最常用、最推荐的旋转方法,它试图使每个因子上的载荷差异最大化,便于解释。直接 Oblimin或Promax:当你假设因子之间存在相关性时使用,大多数情况下,先尝试最大方差法。
- 显示:勾选
旋转解。 - 输出:勾选
载荷图,可以直观地看到变量与因子的关系。 - 点击
继续。
- 方法:
步骤6:因子得分
- 在主对话框中,点击
得分...按钮。 - 在“因子分析:因子得分”对话框中:
- 勾选
另存为变量,SPSS会为每个提取出的因子生成一个新的变量(如FAC1_1,FAC2_1),代表每个样本在每个因子上的得分,这些得分可以用于后续的回归分析等。 - 方法:
回归:最常用的方法,产生的分数均值为0,标准差为1。Bartlett:分数均值为0。
- 显示因子得分系数矩阵:可以查看计算因子得分的系数。
- 点击
继续。
- 勾选
步骤7:选项
- 在主对话框中,点击
选项...按钮。 - 在“因子分析:选项”对话框中:
系数显示格式:- 勾选
按大小排序:让因子载荷按绝对值大小降序排列,方便查看。 - 勾选
取消小系数:在输出中隐藏绝对值小于某个值(如0.4)的载荷,使结果更清晰,这个值可以根据你的研究调整,0.3或0.4是常见阈值。
- 勾选
- 点击
继续,然后点击确定,开始运行分析。
第三部分:结果解读
SPSS输出结果很多,我们需要重点关注以下几个部分。
KMO和Bartlett检验
- KMO (Kaiser-Meyer-Olkin) 测度:
- 作用:检验变量间的相关性是否足够强,判断数据是否适合做因子分析。
- 解读:值在0到1之间。> 0.9 表示极好;> 0.8 表示良好;> 0.7 表示中等;> 0.6 表示勉强可接受;< 0.5 表示不合适。
- Bartlett的球形度检验:
- 作用:检验相关系数矩阵是否为单位阵(即变量间是否独立)。
- 解读:看显著性。Sig. < 0.05,则拒绝原假设(变量间独立),说明变量间存在相关性,适合做因子分析。
如果KMO > 0.6 且 Bartlett检验Sig. < 0.05,则可以继续进行因子分析。
总方差解释
这个表格告诉你提取出的每个因子有多大的“威力”。

- 初始特征值:
- 总计:就是每个因子的特征值,我们提取的是特征值>1的因子。
- 方差百分比:每个因子解释的原始变量总方差的百分比。
- 累积百分比:所有提取出的因子共同解释的总方差百分比。
- 旋转后平方和载入:
这个表格是经过旋转后的结果,旋转不会改变每个因子的总解释力(累积百分比不变),但会重新分配每个因子对原始变量的解释方差,使得每个因子的意义更清晰。
提取了3个因子,它们共同解释了总方差的65%,说明这3个因子能够很好地代表原始15个变量的信息。
成分矩阵 / 旋转后的成分矩阵
这是解读因子含义的核心表格。
- 成分矩阵:是未旋转的因子载荷矩阵,通常比较乱。
- 旋转后的成分矩阵:是我们需要重点看的,它显示了每个原始变量在各个因子上的因子载荷。
如何解读因子载荷?
- 因子载荷的绝对值越大(通常以 ±0.4 或 ±0.5 为界),说明该变量与这个因子的关系越强。
- 正载荷:正相关。“薪水公平”在“薪酬”因子上有正载荷,意味着认为薪水公平的人,对该因子的得分也高。
- 负载荷:负相关。
如何给因子命名?
- 找出每个因子上载荷高(如 > 0.5)的变量。
- 分析这些变量的共同主题,它们共同测量了什么概念?
- 为这个因子起一个概括性的名字。
示例解读: 假设旋转后的矩阵如下:
| 变量 | 因子1 | 因子2 | 因子3 |
|---|---|---|---|
| Q1 薪水公平 | .85 | .10 | .05 |
| Q2 福利待遇 | .82 | .15 | .08 |
| Q3 奖金激励 | .78 | .20 | .12 |
| Q4 工作自主性 | .10 | .88 | .05 |
| Q5 工作挑战性 | .15 | .85 | .10 |
| Q6 能力发挥 | .05 | .80 | .20 |
| Q7 同事关系 | .05 | .10 | .92 |
| Q8 上级支持 | .10 | .15 | .90 |
- 因子1:
Q1,Q2,Q3载荷很高,都与“钱”有关,可以命名为 “薪酬福利”。 - 因子2:
Q4,Q5,Q6载荷很高,都与“工作内容”本身有关,可以命名为 “工作本身”。 - 因子3:
Q7,Q8载荷很高,都与“人际关系”有关,可以命名为 “人际关系”。
通过这种方式,你就将15个原始问题成功归纳为了3个有意义的潜在维度。
碎石图
- 作用:辅助判断提取多少个因子。
- 解读:横轴是因子编号,纵轴是特征值,寻找曲线的“拐点”(陡坡变缓的点),在拐点之前,是应该提取的“大石块”(重要因子),拐点之后的是“碎石”(不重要的因子)。
示例解读: 假设图中第1、2、3个因子特征值很高,从第4个因子开始曲线变得平缓,那么结合“特征值大于1”的标准,提取3个因子是合理的。
第四部分:常见问题与注意事项
- 因子提取数量:“特征值大于1”只是一个经验法则,有时会提取过多或过少的因子,需要结合碎石图、理论合理性和因子解释的清晰度来综合判断。
- 因子命名:这是最主观的一步,命名要有理论依据,不能凭空想象,如果某个因子上的所有高载荷变量都无法用一个合理的概念来解释,可能需要重新审视你的分析过程(如是否需要调整旋转方法或删除某些变量)。
- 交叉载荷:如果一个变量在两个或多个因子上的载荷都很高(例如都>0.5),这被称为交叉载荷,会给解释带来困难,可以考虑删除该变量,或者尝试使用不同的旋转方法。
- 共同度:在“描述性统计”中输出的“初始”共同度,表示该变量能被所有提取的因子共同解释的比例,如果某个变量的共同度很低(如<0.4),说明它与其他变量的共同信息很少,可以考虑从分析中剔除。
- 样本量:因子分析对样本量有一定要求,一般建议样本量至少是变量数的5-10倍,且总样本量不应少于100。
因子分析是一个强大的工具,但它的成功不仅依赖于SPSS的操作,更依赖于研究者对数据的理解和理论知识,记住这个流程:
准备数据 -> 运行分析 -> 检验前提 -> 提取因子 -> 旋转因子 -> 解释因子 -> 命名因子 -> 应用结果
希望这份详细的教程能让你对SPSS因子分析有一个全面而深入的理解!祝你学习顺利!
