相关系数是用以反映变量之间相关关系密切命皮汉序松川越章程度的统计指标。相关系数是按积差来自方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
(Correlation coefficient)
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明来自两个变量之间相关的程度。
著名统计学家卡尔·皮尔逊设计了统计指标--相关系数。 依据相关现象之间的不同特征,其统计指标的名称有所不同。如将跟又其务日难点报自牛行反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数),将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数。将反映多元线性相关关系的统计指标称为复相关系数、复判定系数殖等。
相关系360百科数用r表示,它的基本公式为:
r=\frac{n银及切结规却岩雨在呼天\sum xy-\sum x\sum y}{\sqrt{n\sum x^2-(\sum x)^2}\sqrt{n\sum y^2-(\sum y)^2}}
相关系数的值介于–1与+1之间,即–1≤r≤+1。其性质如下:
* 当r>0时,表示两变量正相关,r<0时,两变量为负氢到派热型益重菜象绿相关。
* 当|r|=1时,表示两变量为完全线性相关,即为函数关系。
* 当r=0时,表示两变量间无线性相关关系。
* 当0<|r|<1时,表示两变量存在一定程度的线性相关。且|r|越接近1,两天学准省下按变量间线性关系越密切;|r|越接近于0,表示两变量的线性相关越弱。
* 一般可按三级划分:|r|<0.4为低度线性相关;0.威落参差关了列广父向4≤|r|<0.7为显著性相关;0.7≤|r|<1为高度线性相关。
如右图
相关系数用来知两川袁名衡量两个数据集合是否在一条守帝面帮而判物难新粉价线上面。
其计算公式为: (右图1,点击放大)
一个具体的计算的例子:
x | y |
1 | 2 |
2 | 5 |
3 | 6 |
计算方法:(图2)