통계 이론

스피어만·켄달 순위상관 개념

Data Jun 2025. 12. 2. 21:45

데이터 분석을 하다 보면 “두 변수 사이에 상관이 있는가?”를 판단해야 할 때가 많습니다. 특히 점수가 아니라 순위(rank) 로 비교해야 할 때는 스피어만(Spearman)켄달(Kendall) 순위상관계수를 사용합니다. 이 글에서는 두 지표가 어떤 개념인지 아주 간단하게 정리해보겠습니다.

 

1. 순위 상관계수가 말하는 ‘상관’의 의미

위 상관에서 말하는 상관이란 아주 단순합니다.

X의 순위가 올라가면 Y의 순위도 올라가는가?
또는
X의 순위가 내려가면 Y도 내려가는가?

 

즉, 두 변수가 같은 방향으로 움직이면 상관이 있다고 판단합니다.
순위 차이가 몇 계단이냐는 중요하지 않습니다.

 

2. 스피어만(Spearman) — 방향성이 중요하다

스피어만 상관계수는 다음을 봅니다:

“X 순위가 증가할 때 Y 순위도 증가하는 패턴이 유지되는가?”

즉,

  • 국어를 잘하는 학생이 수학도 잘하는가?
  • 국어를 못하면 수학도 못하는가?

이런 일관된 패턴이 있으면 스피어만은 상관 있다고 판단합니다.

 

✔ 순위 차이가 1계단이든 10계단이든 중요하지 않아요.
✔ 방향성(오름/내림)이 같으면 높은 상관이 나옵니다.

 

3. 켄달(Kendall) — 우열 비교가 일관적인가?

켄달 상관계수는 스피어만보다 더 “사람의 직관”에 가까운 방식으로 동작합니다.

켄달은 X와 Y를 이렇게 비교합니다:

“A가 B보다 X에서 더 잘했으면,
Y에서도 더 잘해야 상관 있다고 보겠다.”

 

즉, 모든 학생 쌍(pair)을 하나하나 비교해서

  • 우열 관계가 같으면 → 일치(concordant)
  • 우열 관계가 다르면 → 불일치(discordant)

이 비율로 상관을 계산합니다.

✔ 조금이라도 순서가 뒤틀리면 바로 감점되는 엄격한 방식입니다.

 

 

 

정리하면

구분 스피어만 켄달
핵심 기준 순위의 방향성 유지 우열 관계의 일관성
직관성 통계적 인간적·논리적
  • 상관이란 “둘이 같은 방향으로 움직이는가?”를 의미한다.
  • 스피어만: 순위의 전체적인 오름/내림 방향성을 평가
  • 켄달: 모든 쌍의 우열이 일관적인지 평가

둘 다 순위 데이터를 다룰 때 강력하게 사용되는 상관 분석 도구입니다.