데이터 분석을 하다 보면 “두 변수 사이에 상관이 있는가?”를 판단해야 할 때가 많습니다. 특히 점수가 아니라 순위(rank) 로 비교해야 할 때는 스피어만(Spearman) 과 켄달(Kendall) 순위상관계수를 사용합니다. 이 글에서는 두 지표가 어떤 개념인지 아주 간단하게 정리해보겠습니다.
1. 순위 상관계수가 말하는 ‘상관’의 의미
위 상관에서 말하는 상관이란 아주 단순합니다.
X의 순위가 올라가면 Y의 순위도 올라가는가?
또는
X의 순위가 내려가면 Y도 내려가는가?
즉, 두 변수가 같은 방향으로 움직이면 상관이 있다고 판단합니다.
순위 차이가 몇 계단이냐는 중요하지 않습니다.
2. 스피어만(Spearman) — 방향성이 중요하다
스피어만 상관계수는 다음을 봅니다:
“X 순위가 증가할 때 Y 순위도 증가하는 패턴이 유지되는가?”
즉,
- 국어를 잘하는 학생이 수학도 잘하는가?
- 국어를 못하면 수학도 못하는가?
이런 일관된 패턴이 있으면 스피어만은 상관 있다고 판단합니다.
✔ 순위 차이가 1계단이든 10계단이든 중요하지 않아요.
✔ 방향성(오름/내림)이 같으면 높은 상관이 나옵니다.
3. 켄달(Kendall) — 우열 비교가 일관적인가?
켄달 상관계수는 스피어만보다 더 “사람의 직관”에 가까운 방식으로 동작합니다.
켄달은 X와 Y를 이렇게 비교합니다:
“A가 B보다 X에서 더 잘했으면,
Y에서도 더 잘해야 상관 있다고 보겠다.”
즉, 모든 학생 쌍(pair)을 하나하나 비교해서
- 우열 관계가 같으면 → 일치(concordant)
- 우열 관계가 다르면 → 불일치(discordant)
이 비율로 상관을 계산합니다.
✔ 조금이라도 순서가 뒤틀리면 바로 감점되는 엄격한 방식입니다.
정리하면
| 구분 | 스피어만 | 켄달 |
| 핵심 기준 | 순위의 방향성 유지 | 우열 관계의 일관성 |
| 직관성 | 통계적 | 인간적·논리적 |
- 상관이란 “둘이 같은 방향으로 움직이는가?”를 의미한다.
- 스피어만: 순위의 전체적인 오름/내림 방향성을 평가
- 켄달: 모든 쌍의 우열이 일관적인지 평가
둘 다 순위 데이터를 다룰 때 강력하게 사용되는 상관 분석 도구입니다.
'통계 이론' 카테고리의 다른 글
| [확률분포] 이산균일분포 (0) | 2025.12.04 |
|---|---|
| [확률분포] 사상, 확률 및 확률분포 (0) | 2025.12.03 |
| [기술통계] 상관계수 정리 (0) | 2025.12.01 |
| [기술통계] 분산 및 변동계수 (0) | 2025.11.30 |
| [기술통계] 평균의 종류 (0) | 2025.11.29 |