통계 이론

표본 조사의 방법

Data Jun 2025. 3. 2. 19:54

통계학에서 **모집단(population)**과 **표본(sample)**의 개념을 이해하는 것은 매우 중요합니다. 모집단은 우리가 관심을 갖는 연구 대상 전체의 집합을 의미하며, 표본은 모집단에서 일부를 선택한 것입니다. 모집단에서 표본을 어떻게 추출하느냐에 따라 결과의 신뢰성이 달라집니다.

표본추출 방법의 차이와 사례

Literary Digest vs. Gallup (1936년 미국 대선 예측)

  • Literary Digest는 전화기, 자동차 보유자를 대상으로 한 대규모 표본(1,000만 명 중 236만 명 응답)을 사용했지만, 이는 주로 상위 계층에 속하는 사람들로 구성되어 모집단을 대표하지 못했습니다. 결과적으로 실제 선거 결과와 크게 어긋난 예측을 했습니다.
  • Gallup은 무작위 할당 추출(Quota Sampling)을 통해 1,500명의 적은 표본을 선정했음에도 불구하고, 모집단을 대표하는 데이터를 얻어 선거 결과를 더 정확하게 예측했습니다.

 

확률추출 vs. 비확률추출

표본추출은 크게 **확률추출(Probability Sampling)**과 **비확률추출(Non-Probability Sampling)**로 나눌 수 있습니다.

  1. 확률추출(Probability Sampling)
    • 모집단의 모든 구성원이 표본으로 뽑힐 확률이 동일한 방식
    • 단순확률추출(Simple Random Sampling): 모집단의 모든 요소가 동일한 확률로 선택됨 (하지만 모집단 전체에 대한 **추출틀(Sampling Frame)**이 필요하므로 현실적으로 적용하기 어려운 경우가 많음)
    • 층화추출(Stratified Sampling): 모집단을 여러 계층으로 나눈 후, 각 계층에서 랜덤하게 표본을 추출
    • 집락추출(Cluster Sampling): 모집단을 여러 개의 군집(Cluster)으로 나눈 후, 일부 군집을 표본으로 선정하고 해당 군집 내 모든 개체를 조사
  2. 비확률추출(Non-Probability Sampling)
    • 모든 구성원이 동일한 확률로 선택될 보장이 없음
    • 편의추출(Convenience Sampling): 접근이 쉬운 대상들로 표본 구성 (대표성이 낮을 위험 있음)
    • 할당추출(Quota Sampling): 모집단의 특성을 반영할 수 있도록 특정 비율로 표본을 선정 (Gallup이 사용한 방법)

 

단순확률추출(Simple Random Sampling)의 한계와 특징

 

 

단순확률추출은 모집단을 구성하는 모든 개체가 동일한 확률로 표본으로 선택될 수 있도록 하는 방법입니다. 즉, 모든 사람이 뽑힐 확률이 동일해야 하므로 공정한 무작위(Random) 방식으로 진행됩니다.

그러나 이 방법을 실제로 적용하기 어려운 이유는 **추출틀(Sampling Frame)**이 필요하기 때문입니다.

  • **추출틀(Sampling Frame)**이란 모집단의 전체 목록을 의미하며, 단순확률추출을 수행하려면 모집단의 모든 구성 요소가 포함된 리스트가 있어야 합니다.
  • 현실에서는 모집단의 모든 개체를 파악하기 어렵거나, 명확한 리스트가 존재하지 않는 경우가 많기 때문에 단순확률추출을 적용하기 어렵습니다.

 

단순확률추출이 어려운 이유

  1. 모집단 전체의 명단을 확보하기 어렵다 → 모집단이 크거나 이동이 많은 경우 리스트를 만들기가 불가능함.
  2. 비용과 시간이 많이 든다 → 모집단 전체에서 무작위로 표본을 뽑기 위해서는 많은 자원이 필요함.
  3. 현실적인 대안이 필요하다 → 층화추출(Stratified Sampling)이나 할당추출(Quota Sampling) 같은 방법이 더 실용적으로 사용됨.

결론

단순확률추출은 이론적으로 가장 공정한 방식이지만, 실제 연구에서는 모집단의 정확한 리스트(추출틀)가 필요하기 때문에 거의 사용할 수 없는 경우가 많습니다. 대신, 현실적인 표본추출 방법을 선택하는 것이 중요합니다.

'통계 이론' 카테고리의 다른 글

[기술통계분석] 데이터 분석의 기본 개념: 개체, 요인, 변수, 척도, 자료  (0) 2025.03.09
표본 조사의 방법 Part2  (2) 2025.03.02
모집단과 표본  (0) 2025.03.02
통계학이란?  (0) 2025.02.23
가설검정  (0) 2025.02.23