검색하기 전 자주 묻는 질문을 살펴보세요

자주 묻는 질문

조사에 관해 자주 묻는 질문과 답변을 모았습니다

Q. 여론조사에서 언급되는 표본오차는 어떻게 산출되나요?
 

보통 여론조사 한 건에는 다양한 내용이 포함되므로, 편의상 문항별 측정값에 대한 표본오차를 생략하고 전체 표본크기에 따른 최대허용 표본오차만을 제시합니다. 최대허용 표본오차는 해당 표본크기에서 표본오차가 가장 커질 수 있는 조건하의 오차를 의미합니다.

예를 들어 일기예보에서 ‘오늘 오후 비가 올 확률이 50%’라고 하면 비가 온다는 건지, 안 온다는 건지 상당히 혼란스러울 것입니다. 그러나 비가 올 확률이 70~80% 정도라고 하면 아마도 많은 사람들이 우산을 챙겨 외출하겠지요. 즉, 예측 확률이 50%일 때 불확실성이 가장 큽니다. 표본조사에서 이를 수치로 나타낸 것이 최대허용 표본오차입니다.

표본크기와 표본오차는 반비례합니다. 아래 표 맨 윗줄, 즉 응답 비율 50% 가정 시 표본크기가 100명일 때 표본오차 ±9.8%포인트, 500명일 때 ±4.4%포인트로 줄어듭니다. 그러나 1,000명을 넘어서면 표본크기 증가에 따른 표본오차 감소폭이 상대적으로 작습니다.

*표본크기와 표본오차(단위: ±%포인트, 95% 신뢰수준 기준)

응답비율 100 250 500 700 1,000 1,500 2,000
50 (%) 9.8 6.2 4.4 3.7 3.1 2.5 2.2
40 or 60 (%) 9.6 6.1 4.2 3.6 3.0 2.5 2.1
30 or 70 (%) 9.0 5.7 4.0 3.4 2.7 2.3 2.0
20 or 80 (%) 7.8 5.0 3.5 3.0 2.5 2.0 1.8
10 or 90 (%) 5.9 3.7 2.6 2.2 1.9 1.5 1.3

아래는 표본오차를 구하는 계산식입니다. 학술적으로는 모집단이 정규분포를 따라야 한다는 가정이 충족되어야 하지만, 보통 여론조사는 표본수가 크기 때문에 정규분포라 가정합니다.

표본오차 = ±(Z)*SQRT(표본분산/표본수)
 표본분산 = (응답 비율)*(1–응답 비율)
 Z = 1.96: 신뢰수준 95%, 2.58: 신뢰수준 99%
 SQRT: square root, 제곱근

예를 들어, 표본수 2,000명에서 예상 응답 비율 50%라면 표본오차는 ±2.19%포인트로 계산됩니다.
±2.19 = ±(1.96)*SQRT[(0.5)*(1-0.5)/2000]