【线性相关系数r的计算公式是什么】在线性统计分析中,线性相关系数(通常用符号r表示)是衡量两个变量之间线性关系强度和方向的一个重要指标。它可以帮助我们判断两个变量是否呈正相关、负相关或没有明显的线性关系。
线性相关系数r的取值范围在-1到1之间,其中:
- r = 1 表示完全正相关;
- r = -1 表示完全负相关;
- r = 0 表示无线性相关。
以下是线性相关系数r的计算公式及其应用说明。
一、线性相关系数r的计算公式
线性相关系数r的计算公式如下:
$$
r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $ 是数据对的数量;
- $ x $ 和 $ y $ 分别是两个变量的观测值;
- $ \sum xy $ 是所有$ x_i \times y_i $ 的总和;
- $ \sum x $ 和 $ \sum y $ 分别是x和y的总和;
- $ \sum x^2 $ 和 $ \sum y^2 $ 分别是x和y的平方和。
二、线性相关系数r的含义
| r 值范围 | 含义 |
| 0.8 ~ 1.0 | 强正相关 |
| 0.5 ~ 0.8 | 中等正相关 |
| 0.3 ~ 0.5 | 轻微正相关 |
| 0.0 ~ 0.3 | 无明显正相关 |
| -0.3 ~ 0.0 | 无明显负相关 |
| -0.5 ~ -0.3 | 轻微负相关 |
| -0.8 ~ -0.5 | 中等负相关 |
| -1.0 ~ -0.8 | 强负相关 |
三、使用注意事项
1. 仅适用于线性关系:r只能反映两个变量之间的线性相关程度,不能说明非线性关系。
2. 受异常值影响较大:数据中的极端值可能会显著改变r的值。
3. 相关不等于因果:即使两个变量高度相关,也不能说明一个变量的变化是由另一个变量引起的。
四、总结
线性相关系数r是统计学中用于衡量两个变量之间线性关系的重要工具。通过其计算公式,我们可以定量地评估变量之间的相关性强弱。理解r的含义及其使用条件,有助于我们在数据分析中做出更准确的判断。


