相關系數是用以反映變量之間的相關關系程度的統計指標。
其取值范圍是[-1,1],當取值為0時表示不相關,取值為[-1,0)表示負相關,取值為(0,-1],表示負相關。文章源自四五設計網-http://www.wasochina.com/44182.html
目前常用的兩種相關性系數為皮爾森相關系數(Pearson)和斯皮爾曼等級相關系數(Spearman)文章源自四五設計網-http://www.wasochina.com/44182.html
簡介
1.皮爾森相關系數評估兩個連續變量之間的線性關系。文章源自四五設計網-http://www.wasochina.com/44182.html
文章源自四五設計網-http://www.wasochina.com/44182.html
其中:文章源自四五設計網-http://www.wasochina.com/44182.html
文章源自四五設計網-http://www.wasochina.com/44182.html
-1 ≤ p ≤ 1文章源自四五設計網-http://www.wasochina.com/44182.html
p接近0代表無相關性文章源自四五設計網-http://www.wasochina.com/44182.html
p接近1或-1代表強相關性文章源自四五設計網-http://www.wasochina.com/44182.html
2.斯皮爾曼相關系數評估兩個連續變量之間的單調關系。在單調關系中,變量趨于一起變化,但不一定以恒定速率變化。文章源自四五設計網-http://www.wasochina.com/44182.html
其中:
N是觀測值的總數量
斯皮爾曼另一種表達公式:
表示二列成對變量的等級差數。
區別
Pearson和Spearman相關系數的范圍可以從-1到+1。
當Pearson相關系數為+1時,意味著,當一個變量增加時,另一個變量增加一致量。
這形成了一種遞增的直線。
在這種情況下,Spearman相關系數也是+1。
如果關系是一個變量在另一個變量增加時增加,但數量不一致,則Pearson相關系數為正但小于+1。
在這種情況下,斯皮爾曼系數仍然等于+1。
當關系是隨機的或不存在時,則兩個相關系數幾乎為零。
如果關系遞減的直線,那么兩個相關系數都是-1。
如果關系是一個變量在另一個變量增加時減少,但數量不一致,則Pearson相關系數為負但大于-1。
在這種情況下,斯皮爾曼系數仍然等于-1
相關值-1或1意味著精確的線性關系,如圓的半徑和圓周之間的關系。
然而,相關值的實際價值在于量化不完美的關系。
發現兩個變量是相關的經常通知回歸分析,該分析試圖更多地描述這種類型的關系。
其他非線性關系
Pearson相關系數僅評估線性關系。Spearman相關系數僅評估單調關系。
因此,即使相關系數為0,也可以存在有意義的關系。
檢查散點圖以確定關系的形式。
該圖顯示了非常強的關系。
Pearson系數和Spearman系數均約為0。
結論
皮爾森評估的是兩個變量的線性關系,而斯皮爾曼評估的兩變量的單調關系。
因此,斯皮爾曼相關系數對于數據錯誤和極端值的反應不敏感。
以上為個人經驗,希望能給大家一個參考


評論