새소식

데이터분석/다섯째주

상관관계 (Correlation Coefficient)

  • -
728x90

 

상관관계 (Correlation Coefficient)

두 변량 사이에 한쪽이 증가하면, 다른 쪽도 증가(또는 감소)하는 경향이 있을때를 상관관계가 있다고 한다.

상관관계는 두 변수 간의 직선관계를 나타낸다.

 단, 상관관계가 있다하여 두 변량이 인과관계인 것은 아니다. 

  • -1에 가까울수록 강한 음의 관계
  • +1에 가까울수록 강한 양의 관계

 

산점도로 상관관계 살펴보기

산점도는 상관관계를 분석하는데 있어서 가장 기본적이고 직관적인 방법이다.

산점도에서 분포가 직선에 가까울수록 상관관계가 높다고 할 수 있다.

  • 0.2 이하 : 상관관계가 없거나 무시해도 좋은 수준
  • 0.4 이하 : 약한 상관관계
  • 0.6 이상 : 강한 상관관계

 

음의 상관관계가
강하다.
음의 상관관계가
있기는 하다.
상관관계가
없다.
양의 상관관계가
있기는 하다.
양의 상관관계가
강하다.

 

 

 

 

파이썬 이용

 데이터프레임 변수명 . corr( )   

 

 

 

 

 

반응형
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.