상관관계 (Correlation Coefficient)
두 변량 사이에 한쪽이 증가하면, 다른 쪽도 증가(또는 감소)하는 경향이 있을때를 상관관계가 있다고 한다.
상관관계는 두 변수 간의 직선관계를 나타낸다.
단, 상관관계가 있다하여 두 변량이 인과관계인 것은 아니다.
- -1에 가까울수록 강한 음의 관계
- +1에 가까울수록 강한 양의 관계
산점도로 상관관계 살펴보기
산점도는 상관관계를 분석하는데 있어서 가장 기본적이고 직관적인 방법이다.
산점도에서 분포가 직선에 가까울수록 상관관계가 높다고 할 수 있다.
- 0.2 이하 : 상관관계가 없거나 무시해도 좋은 수준
- 0.4 이하 : 약한 상관관계
- 0.6 이상 : 강한 상관관계
음의 상관관계가 강하다. |
음의 상관관계가 있기는 하다. |
상관관계가 없다. |
양의 상관관계가 있기는 하다. |
양의 상관관계가 강하다. |
파이썬 이용
데이터프레임 변수명 . corr( )