통계 이론

[확률분포] 정규분포

Data Jun 2025. 12. 7. 10:01

정규분포는 우리가 흔히 말하는 종 모양 곡선을 그리는 확률분포입니다.
평균을 중심으로 좌우가 대칭을 이루며,
자연·사회·검정 데이터 등 실제 세계에서 매우 자주 나타나는 분포죠.

 

1. 이항분포가 정규분포처럼 보이는 이유

정규분포는 갑자기 하늘에서 뚝 떨어지는 분포가 아닙니다.
흔히 보는 이항분포가 시행 횟수가 많아질수록 정규분포 형태로 가까워진다는 특징이 있습니다.


1️⃣ 동전 10번 던지기 → 앞면 횟수 기록

 

먼저 동전을 10번 던지고,
그 10번 중 앞면이 몇 번 나왔는지를 기록합니다.

 

예를 들어

  • 앞면 3번
  • 앞면 7번
  • 앞면 4번

이런 식이죠.

 

2️⃣  이 실험을 여러 번 반복하면?

 

실험 반복 횟수를 늘리면 아래처럼 변화합니다:

  • 10회 반복 → 들쑥날쑥한 막대
  • 20회 반복 → 조금 모양이 잡힘
  • 100회 반복 → 가운데가 점점 두꺼워짐
  • 1000회 반복 → 종 모양의 정규분포 그래프와 거의 비슷해짐

이 과정은 **중심극한정리(Central Limit Theorem)**의 대표적 예시입니다.

 

2. 1000회 반복했을 때 'X축 = 5, Y축 = 350'의 의미

도수
400 |                        
350 |                 █        ← X = 5 에서 도수 ≈ 350
300 |              █  █  █
250 |           █  █  █  █  █
200 |        █  █  █  █  █  █ █
150 |     █  █  █  █  █  █  █ █  █
100 |  █  █  █  █  █  █  █  █ █  █  █
      0  1  2  3  4  5  6  7  8  9  10   (앞면 횟수 X)

그래프에서
X축 = 앞면이 나온 횟수
Y축 = 그 횟수가 나온 도수(발생 빈도)
를 나타냅니다.

 

따라서,

동전 10번 던지기 실험을 총 1000번 했더니,
그 중 약 350번의 실험에서 앞면이 정확히 5번 나왔다.

라는 의미입니다.

 

왜 5가 가장 많이 나올까요?

 

동전의 앞면 확률은 0.5이기 때문에
10번 중 기대되는 평균은:

  • 10 × 0.5 = 5

즉, 가장 가능성이 높은 값이기 때문에
히스토그램의 가장 높은 막대가 X=5에서 나타나는 것입니다.

 

3. 왜 종 모양이 나타날까?

동전 10번 던지기는 사실 이항분포입니다.
하지만 반복 횟수를 높이면 높일수록,
이항분포의 막대들이 자연스럽게 부드러운 곡선 형태를 띠게 되고
그 곡선이 바로 정규분포와 매우 비슷해집니다.

 

그리고 평균에 해당하는 X=5를 중심으로
좌우가 점점 대칭적인 모양을 이루죠.

 

 

정리하면

 

핵심은 단순하지만 매우 강력합니다.

단순한 확률 실험도 반복 횟수가 충분히 많아지면
자연스럽게 정규분포의 모습을 띠게 된다.

 

이 원리가 통계에서 정규분포가 중요한 이유이며,
많은 실제 데이터가 종 모양을 보이는 이유기도 합니다.

 

'통계 이론' 카테고리의 다른 글

표준점수란  (0) 2025.12.09
[확률분포] 표준화와 표준정규분포  (0) 2025.12.08
[확률분포] 이항분포  (0) 2025.12.06
[확률분포] 연속형 균일분포  (0) 2025.12.06
[확률분포] 이산균일분포  (0) 2025.12.04