본문 바로가기

Tech

통계 - 상관관계 & 인과관계

인과관계와 상관관계의 차이점을 간단히 요약하면 다음과 같습니다:

 

  • 상관관계 (Correlation): 두 변수 간의 연관성을 나타냅니다. 한 변수가 변화할 때 다른 변수도 일정한 패턴으로 변화하는 경향이 있을 때 상관관계가 있다고 합니다. 상관관계는 방향(양의 상관관계 또는 음의 상관관계)과 정도(강도)를 나타내지만, 한 변수가 다른 변수의 원인이라고는 말하지 않습니다.
    • 예시: 아이스크림 판매량과 익사 사고 수가 동시에 증가하는 경우, 이 둘은 상관관계가 있습니다. 그러나 이는 여름이라는 공통의 원인에 의해 동시에 증가하는 것이지, 아이스크림 판매가 익사 사고의 원인이라고 할 수는 없습니다.
  • 인과관계 (Causation): 한 변수가 다른 변수의 원인이 되는 관계를 나타냅니다. 즉, 하나의 사건이 다른 사건을 직접적으로 초래할 때 인과관계가 있다고 합니다. 인과관계는 원인과 결과의 관계를 명확히 합니다.
    • 예시: 흡연과 폐암 사이의 관계에서, 흡연은 폐암의 원인입니다. 이 경우 흡연은 원인 변수이고 폐암은 결과 변수.

요약

  • 상관관계: 두 변수 간에 관계가 존재하지만, 원인과 결과를 명확히 알 수 없음.
  • 인과관계: 한 변수가 다른 변수의 원인이 되는 명확한 관계.