확률을 공부하다 보면 처음에 헷갈리는 개념이 바로 사상(Event), 확률(Probability), **확률변수(Random Variable)**입니다.
이 세 가지는 따로 존재하는 것 같지만, 실제로는 하나의 흐름처럼 자연스럽게 이어져 있습니다.
아래에서는 너무 수학적이지 않게, 예시와 함께 하나씩 풀어보겠습니다.
1. 표본공간과 사상
확률 이야기를 할 때 가장 바닥에 깔리는 두 가지 개념이 **표본공간(Ω)**과 **사상(Event)**이에요.
사실 사상은 표본공간 없이는 정의될 수 없어서, 두 개를 같이 묶어서 보는 게 흐름상 훨씬 자연스럽습니다.
1️⃣ 표본공간이란?
동전 한 번 던지기:
Ω = {앞, 뒤}
주사위 한 번 던지기:
Ω = {1, 2, 3, 4, 5, 6}
표본공간(Ω)은 어떤 실험을 했을 때 나올 수 있는 모든 가능한 결과의 집합입니다.
“이 실험에서 일어날 수 있는 경우는 이만큼 있어요”라고 선언해주는 역할이에요.
2️⃣ 사상이란?
# 주사위 예시
Ω = {1, 2, 3, 4, 5, 6}
A = {2, 4, 6} # 짝수가 나오는 사상
B = {1, 3, 5} # 홀수가 나오는 사상
사상(Event)은 표본공간 안에 있는 결과들 중에서,
우리가 관심 있는 결과들을 모아놓은 부분집합입니다.
그래서 항상 이렇게 표현할 수 있어요:
A ⊆ Ω # 사상 A는 표본공간 Ω의 부분집합이다.
즉,
- 표본공간이 “모든 경우의 수”라면
- 사상은 “그중에서 우리가 보고 싶은 경우들만 모은 집합”입니다.
3️⃣ 표본공간과 사상의 관계를 한 번에 보기
주사위 한 번 던지기
표본공간:
Ω = {1, 2, 3, 4, 5, 6}
사상 예시:
A = {2, 4, 6} # 짝수가 나오는 사건
B = {1, 3, 5} # 홀수가 나오는 사건
C = {6} # 6이 나오는 사건
관계:
A ⊆ Ω
B ⊆ Ω
C ⊆ Ω
2. 확률(Probability)
사상이 결정되면, 이제 그 사상이 일어날 가능성을 숫자로 표현한 것이 바로 확률입니다.
1️⃣ 확률이 따라야 하는 규칙
0 ≤ P(A) ≤ 1
P(Ω) = 1
P(A ∪ B) = P(A) + P(B) # A와 B가 서로 배반일 때
확률은 항상 0과 1 사이에서 움직이고, 모든 일이 반드시 일어난다고 가정한 전체 결과의 확률은 1입니다.
서로 겹치지 않는 두 사건은 더해서 계산할 수 있다는 점도 기억할 만합니다.
2️⃣ 공정한 동전의 예시
P({앞}) = 1/2
3️⃣ 주사위에서 짝수가 나올 확률
P({2, 4, 6}) = 3/6 = 1/2
6개 결과 중 3개가 짝수이기 때문에 확률은 1/2로 계산됩니다.
이런 예시는 ‘확률은 전체에서 얼마나 차지하는가’라는 직관을 잘 보여줍니다.
3. 확률변수(Random Variable)
확률변수라는 말 때문에 어렵게 느껴질 수 있지만, 사실 개념은 아주 단순합니다.
확률변수는 확률 실험에서 얻어진 결과를 숫자로 표현한 것이에요.
예를 들어 어떤 실험을 했을 때, 그 결과가 “A”, “B”, “C”처럼 문자일 수도 있고 “성공/실패”처럼 단어일 수도 있죠.
하지만 분석이나 모델링을 하려면 숫자가 필요하기 때문에, 그 결과를 숫자로 바꿔서 다룬 것이 바로 확률변수입니다.
1️⃣ 확률변수의 직관적인 의미
확률변수란 실험에서 어떤 결과가 나왔는지를 숫자로 표현한 값이다.
이게 가장 본질적인 정의입니다.
결과가 원래 숫자라면 그대로 숫자를 쓰고,
숫자가 아니라면 우리가 약속을 정해서 숫자로 대응시키면 됩니다.
2️⃣ 숫자가 아닌 결과도 숫자로 바꾸면 확률변수가 된다
예: 성공 → 1
실패 → 0
이렇게 정해두면 ‘성공/실패’라는 실험 결과도 쉽게 숫자로 다룰 수 있죠.
현실에서 다루는 데이터의 상당수가 이런 방식으로 표현됩니다.
3️⃣ 왜 이런 개념이 필요할까?
확률변수가 있어야 결과를 수치로 분석할 수 있다.
기대값, 분산 같은 계산도 가능해지고,
나중에 확률분포나 머신러닝 모델과도 자연스럽게 연결됩니다.
정리하면
- 표본공간은 어떤 실험에서 나올 수 있는 모든 가능한 결과의 집합이고,
사상은 그 표본공간 안에서 특정 조건을 만족하는 결과들을 모아놓은 부분집합입니다. - 확률은 어떤 사상이 실제로 일어날 가능성을 0에서 1 사이 숫자로 표현한 값입니다.
- 확률변수는 실험의 결과를 숫자로 표현해 분석 가능하게 만드는 매커니즘이며,
그 매커니즘이 실제 실험 결과에 따라 출력한 숫자가 확률변수의 값입니다.
'통계 이론' 카테고리의 다른 글
| [확률분포] 연속형 균일분포 (0) | 2025.12.06 |
|---|---|
| [확률분포] 이산균일분포 (0) | 2025.12.04 |
| 스피어만·켄달 순위상관 개념 (0) | 2025.12.02 |
| [기술통계] 상관계수 정리 (0) | 2025.12.01 |
| [기술통계] 분산 및 변동계수 (0) | 2025.11.30 |