검색하기 전 자주 묻는 질문을 살펴보세요

조사담(調査談)

한국갤럽, 조사인, 조사 이야기

데일리 오피니언 전화조사 표본설계: 무선전화 가상번호
2023/07/11
● 한국갤럽 2023년 7월 11일 공개 | 문의: 02-3702-2571/2621/2622

──────────────────────
데일리 오피니언 전화조사 표본설계:
무선전화 가상번호

──────────────────────

1. 들어가며

한국갤럽 데일리 오피니언(이하 ‘데일리 오피니언’)은 2012년 1월부터 한국갤럽이 매주 운영해 온 전화조사 프로그램으로, 2023년 6월 말 통권 제548호를 발행했다. 대통령 직무수행평가와 정당 지지도를 비롯한 기본 국정 지표와 주요 정치 현안, 경제, 사회, 생활, 문화 등 다방면에 관한 한국인의 생각을 물어 집계·분석한 결과를 매주 금요일 오전 10시 홈페이지에 공개한다. 한국갤럽이 자체 기획하고 비용을 부담하며, 관심 있는 사람이면 누구나 무료로 조사 결과를 활용할 수 있다.

데일리 오피니언의 대외적 역할은 더 많은 일반 시민이 조사 결과에 쉽게 접근하고 활용할 수 있게 하는 것이며, 대내적 역할은 조사 과정의 질적 향상에 필요한 데이터를 축적하는 것이다. 이를 위한 데일리 오피니언 운영의 기본 원칙은 세 가지다: 정치권, 이해 관계자, 특정 언론 의뢰가 아닌 독립적인 조사로 어느 한쪽에 치우침 없이 공정할 것(중립성), 여론의 변화를 상시 추적할 것(지속성), 모집단의 특성을 최대한 반영할 것(대표성).

모집단 대표성 확보를 위해서는 표본설계가 핵심 요건이다. 본 문서는 데일리 오피니언의 표본설계와 실행 방법을 구체적으로 기술한 보고서다. 표본설계의 일반적 절차에 따라 (1) 모집단 정의, (2) 표본추출틀 설정, (3) 표본크기 결정, (4) 층화변수 설정, (5) 층별 배분, (6) 표본추출, (7) 가중치 산정과 모수추정을 순차적으로 설명한다.

2. 표본설계

(1) 모집단 정의
데일리 오피니언의 목표 모집단은 대한민국 유권자, 즉 만 18세 이상(이하 연령은 모두 만 나이) 국민이다. 유권자의 정의는 공직선거법 제15조1항(‘18세 이상의 국민은 대통령 및 국회의원의 선거권이 있다.’ 등)에 따른다. 대통령선거, 국회의원선거, 지방선거 등 전국 단위 선거가 있는 해에는 선거일을 기준으로, 전국 단위 선거를 앞두지 않았거나 선거가 없는 해에는 조사일을 기준으로 18세 이상을 가린다.

목표 모집단 전체 규모는 행정안전부 주민등록인구현황(이하 2023년 6월 말 기준) 기준 18세 이상 전국 인구 44,217,833명이다. 모집단 분포 특성을 성별로 보면 남성 21,922,847명(49.6%), 여성 22,294,986명(50.4%)이다. 연령대별로는 18~29세 7,234,899명(16.4%), 30~39세 6,588,552명(14.9%), 40~49세 7,998,075명(18.1%), 50~59세 8,627,184명(19.5%), 60~69세 7,553,882명(17.1%), 70세 이상 6,215,241명(14.1%)이다. 고령자가 증가함에 따라 2022년부터 60대와 70세 이상을 구분한다. 모집단의 시/도별, 성별, 연령대별 인구수와 구성비는 〈표 1〉에 정리했다.



(2) 표본추출틀
데일리 오피니언은 우리 사회 전반의 현안과 관심사를 추적하고자 연중 상시 운영한다. 주간 단위로 지속적이고 안정적으로 진행 과정을 관리할 수 있으면서 모집단 대표성을 최대한 확보할 수 있는 조사방법은 전화조사다. 2023년 현재 전화조사에 가용한 표본추출틀(sampling frame)은 유선전화 RDD 번호, 무선전화 RDD 번호, 무선전화 가상번호 등이다. 각각의 장단점은 〈표 2〉에 정리했다.

유선전화는 1990년대 초반부터 조사에 널리 활용됐으나, 2010년 이후로는 주된 표본추출틀로서의 가치를 거의 상실했다. 한국갤럽 전국 옴니버스 면접조사에서 가구 내 유선전화 보유율은 2015년 69%에서 2023년 22%로 급감했고, 실제 이용률은 보유율보다 현저히 낮다(이하 별도 표시 없는 통계 출처는 모두 한국갤럽). 따라서, 데일리 오피니언의 조사 모집단은 무선전화를 통해 조사 가능한 18세 이상 국민으로 정의한다.

우리나라 유권자의 무선전화 이용률은 100%에 가깝다. → 과학기술정보통신부 무선통신서비스 통계에 따르면, 2023년 5월 고객용 무선전화 회선은 같은 달 총인구수(약 5,140만 명, → 행정안전부)를 상회하는 약 5,596만 개다. 이 중 4,802만 회선이 이동통신 3사(SKT, KT, LG U+), 약 794만 회선은 MVNO(가상이동통신망사업자, 일명 ‘알뜰폰’) 서비스에 가입되어 있다. 이 통계에는 다수 회선 보유자와 비유권자까지 포함되어 있지만, 사실상 18세 이상 유권자 대부분이 무선전화를 이용한다고 봐도 무방할 것이다. 참고로, 스마트폰 사용률은 2012년 50%대, 2022년 97%에 달했다.

RDD(Random Digit Dialing)는 무작위 생성한 전화번호를 활용하는 방식을 의미한다. 엄밀히 말하면 목록이 아니라 과학적 확률추출을 할 수 있는 방법 또는 절차라 할 수 있다. 무선전화 가상번호는 공직선거법이 허용하는 선거여론조사에 한해 이동통신 3사가 유료 제공하는 번호로, 2016년 제20대 국회의원선거 직전 최초 도입됐다. 지역·성별·연령대 정보를 포함하지만 문자 안내 등은 불가한 한시적 임시 번호다.



무선전화 RDD는 국번 대역에서 번호를 무작위 생성하여 모집단 전체를 포함한다. 무선전화 이용자라면 누구나 RDD 방식의 조사 대상으로 선정될 수 있다. RDD 번호는 그 자체로 보면 순수하게 난수 발생한 숫자 조합일 뿐이어서, 그 번호가 유효한지 어떤 사람이 이용하는지에 관한 정보가 없다. 그래서 모집단에 속하는지를 확인하고 가려내는 작업을 선행하는 데 많은 시간과 인력이 투입된다. 전국적으로 보면 실제 인구 분포에 근접하지만, 통상 며칠간 1,000명을 목표로 진행하는 전화조사 과정에서 특정 지역의 부족한 표본 한두 사례 표집은 상당히 어려워 국번으로 지역 구분이 가능한 유선전화 RDD를 일부 추가하여 보완하기도 한다.
대표적인 확률표본추출 방식에는 단순확률추출, 계통추출, 층화추출, 집락추출 등이 있는데 이중 층화추출이나 집락추출은 주요 특성에 대한 사전 정보가 필요하다. 주요 특성에 대한 사전 정보가 없는 무선전화 RDD 번호에는 전체 번호 대역에서 단순확률추출 또는 계통추출을 적용한다.

무선전화 가상번호는 선거여론조사기관(정당, 조사회사 등)이 중앙여론조사심의위원회를 통해 이동통신 3사에 요청하여 소정의 비용을 지불하고 제공받는 번호다. 이동통신 3사는 자사 이용자의 기존 정보를 바탕으로 요청받은 조건(지역·성별·연령대)에 맞게 번호를 제공한다. 모집단 포함 여부 확인 작업 간소화로 무선전화 RDD보다 시간과 인력 운용 측면에서 효율적이다. 사전 정보가 있는 무선전화 가상번호에는 주요 특성에 따라 층별 표본배분 후 각각의 층에서 번호를 추출하는 층화추출을 적용할 수 있다. 층화추출은 모수추정의 분산을 줄여 조사에 정교성을 더할 수 있다.


데일리 오피니언은 모집단 대표성을 우선시하여 2012년부터 무선전화 RDD를 기본 표본추출틀로 활용해 왔으나, 아래 세 가지 사유로 2023년 7월부터 무선전화 가상번호로 변경한다.

첫째, 최근 전화조사 응답률(접촉 대비 조사 참여 완료 비율) 급락과 무선전화 이용자 특성에 따른 응답률 불균형성 심화에 대응하기 위해서다. 지난 10여 년간 데일리 오피니언 기준 연평균 응답률은 15~20% 사이를 유지했다: 2012년 20%, 2013년 17%, 2014년 16%, 2015년 17%, 2015년 17%, 2016년 21%, 2017년 19%, 2018년 16%, 2019년 16%, 2020년 14%, 2021년 15%, 2022년 11.3%, 2023년 1~5월 9.5%. 주요 선거와 정치적 국면(국정농단, 탄핵 등) 전후 한동안 오르거나 낮아졌다가 평년 수준으로 되돌아가곤 했는데, 2022년 상반기 대통령선거와 지방선거를 거치며 10% 내외로 낮아진 응답률은 현재까지 회복되지 않고 있다.
남성 대비 여성, 20·30대 조사는 한층 어려워져 주민등록인구 기준 가중 처리 시 가중값 배율이 과거보다 높아졌다. 무차별적 텔레마케팅과 선거홍보전, 무분별한 ARS 조사와 왜곡된 해석 난립, 정치적 양극화 등이 전반적인 조사 환경 황폐화의 원인으로 짐작된다.
무선전화 RDD는 사전 정보 확인을 위해 아주 많은 사람과 통화해야 한다. 이 과정에서 조사 대상 비적격자 입장에서는 불필요한 통화를 부담하게 되는데, 거주지·성별·연령대 정보가 포함된 무선전화 가상번호는 이를 최소화할 수 있다. 따라서 전화조사에 대한 인식과 여건이 나아질 때까지 무선전화 가상번호를 활용할 것이다.

둘째, 무선전화 가상번호는 이동통신 3사만 제공하므로 알뜰폰 이용자가 원천적으로 배제된다는 제약이 있다. 전체 무선전화 회선에서 알뜰폰 이용자가 차지하는 추정 비율은 2020년 10%에서 2023년 14%로 늘었다. 또한 이동통신 3사 이용자는 자신의 가상번호 제공을 거부할 수 있다. 이들 역시 조사 대상에서 제외된다. 그러나 이 부족한 포함률이 전체 조사 결과에 아직은 큰 영향을 주지 않는 것으로 보인다.
데일리 오피니언 기응답자를 분석한 결과, 이동통신 3사와 알뜰폰 이용자 간 인구적 특성이나 정치적 성향 차이는 크지 않은 것으로 나타났다. 알뜰폰 이용자가 장기적으로 더 증가한다면, 지금은 미미한 차이가 앞으로 확대될 가능성도 있다. 한국갤럽은 선거여론조사 이외 대부분 전화조사에 무선전화 RDD를 활용하므로, 알뜰폰 이용자와 비이용자 간 차이를 계속해서 주시 분석할 것이다.

셋째, 데일리 오피니언은 한국갤럽이 자체적으로 기획·운영·공표하는 조사 프로그램이다. 진행 과정을 철저히 관찰·기록하여 조사회사뿐 아니라 유관 분야 연구자들이 학습하고 전문 지식을 향상하는 데 기여하고자 시작했다. 2012년부터 매주 무선전화 RDD 조사를 진행하면서 과정과 데이터에 관한 발견 사항을 여러 담론과 학술 논문으로 공유했다. 앞으로는 무선전화 가상번호에 대해서도 그런 연구를 할 것이다.

(3) 표본크기
데일리 오피니언의 주간 단위 목표 표본크기는 1,000명이다. 단순확률추출 가정 시 표본크기에 대한 목표 표본오차는 ±3.1%포인트(95% 신뢰수준)다. 표본크기 1,000명의 통계치는 대체로 안정적이다. 중앙선거관리위원회의 선거여론조사 기준에서도 전국 단위 조사의 최소 표본크기를 1,000명으로 한다. 표본크기별 표본오차는 〈표 3〉에 제시했다.



(4) 층화
무선전화 RDD 번호로는 이용자 특성별 층화 후 표본을 추출하는 층화추출을 적용할 수 없으나 가상번호 활용 시 사전 정보를 통한 층화추출의 적용이 가능하다. 이에 따라 모집단 분석을 통해 층화변수를 설정하고 층별 목표 표본크기를 배분한다.
층화변수는 거주지, 성별, 연령대로 한다. 거주지는 전국 17개 광역자치단체를 8개 권역으로 구분한다(서울, 인천/경기, 강원, 대전/세종/충청, 광주/전라, 대구/경북, 부산/울산/경남, 제주). 연령대는 10세 단위를 기준으로 하되 18, 19세는 20대와 통합하여 18~29세로 하며, 고령자가 증가함에 따라 60세 이상 인구비가 30%를 초과한 시점인 2022년부터 60대와 70세 이상을 구분한다. 전국 권역, 성별, 연령대 기준 모집단 인구수와 구성비는 〈표 4〉와 〈표 5〉에 정리했다.





(5) 층별 표본배분
층별 표본배분은 층화변수를 기준으로 모집단 인구수에 비례하는 비례배분법을 적용하며, 1,000명의 표본을 할당한 결과는 〈표 6〉에 제시했다.



(6) 표본추출
무선전화 가상번호는 이동통신 3사 가입자 상대 점유율에 비례하여 층별로 배분한다. 2023년 5월 기준 이동통신 3사 가입자의 상대 점유율 추정치는 SKT 48%, KT 28%, LGU+ 23%다. 전체 목표 응답률에 따라 k배의 번호를 추출한다. 응답률 5%일 때 k=20이며, 1,000명 표본 확보를 위해 필요한 번호는 2만 개다. 이동통신 3사 점유율을 고려해 세부 특성(층)별 수량을 나누고, 각 사에 번호를 요청한다. 이동통신사로부터 제공받은 무선전화 가상번호가 추출된 표본이다. 이때 층별로도 응답률을 고려해 배수를 정한다.
층별 응답률은 2023년 상반기 데일리 오피니언 조사에서 무선전화 RDD 1차 접촉 시 시도별, 성·연령대별 응답자 비율을 기준으로 산출했다. 향후 무선전화 가상번호 활용 데이터가 누적되면 층별 응답률 정보도 주기적으로 갱신할 계획이다. 전체 1,000명 표본 확보를 목표로 사흘간 반복 접촉 시도하며(콜백, callback), 끝까지 조사에 참여한 사람을 최종 응답 표본으로 본다.

(7) 가중치 산정과 모수추정
아래는 층화추출법을 적용한 표본조사에서 가중치 산정과 모수추정에 대한 설명이다.

① 가중치 산정
가중치는 표본조사에서 표본추출방식을 반영한 설계가중치, 조사 과정의 무응답을 보정하는 무응답보정가중치와 모집단에 대한 정보를 통해 모집단의 구조와 표본 구조를 일치시키는 사후층화보정가중치를 곱해서 산출한다. 표본조사에서 가중치 적용은 모수추정에서 편향(bias)을 줄이기 위한 것이다.



② 모수추정식




3. 마무리하며

이상으로 모집단 정의부터 모수추정까지 데일리 오피니언 표본설계 전 과정을 설명했다. 오차는 조사 실행 전반에 걸쳐 발생할 수 있다. 데일리 오피니언 표본설계는 확률추출이라는 과학적 절차를 최대한 준수하여 표본오차를 최소화하는 동시에, 무응답 등 현실에서 발생할 수 있는 비표본오차 영역까지 고려하여 보완하고자 했다.
조사 전 과정의 체계적 관리, 표본추출틀의 포함률과 응답률(접촉성공률과 협조율)1) 제고, 모집단과의 모사(模寫)라는 측면에서 표본 대표성 확보, 시대상을 적절히 반영하는 질문지 작성, 엄밀한 결과 분석 등이 모두 조사의 정확성을 높이기 위한 선결 요건이다.

정확한 조사와 공정한 여론 수렴은 조사회사의 노력, 언론의 신중한 접근, 시민의 적극적인 참여가 공존해야 가능한 일이다. 조사회사는 전 국민을 대표하는 표본 확보 노력을 지속해야 한다. 언론은 여러 조사 결과를 ‘들쑥날쑥 못 믿을 조사’로 싸잡아 비난하기보다 좋은 조사를 가려 인용해야 한다. 흔히 선거를 민주주의의 근간이라고 한다. 그러나 선거는 몇 년에 한 번 있을 뿐이다. 평상시 다양한 현안 여론조사에 참여하는 것은 투표 못지않게 시민의 의견을 표출할 수 있는 기회란 인식이 널리 알려지길 바란다.



참고문헌
박무익, 이계오, 이기재 (2017) 여론조사의 이해. 한국방송통신대학교출판문화원
이계오, 박진우, 이기재 (2021) 표본조사론. 한국방송통신대학교출판문화원
통계청 (2008) 표본오차 매뉴얼
통계청 (2021) 2020년 국가통계 품질관리 매뉴얼(조사통계)
중앙선거여론조사심의위원회 (2021) 선거여론조사기준
Kish, L. (1965) Survey sampling. New York, NY: John Wiley & Sons
Sharon L. Lohr (1999) Sampling: Design and Analysis. Duxbury Press


연관 조사談
데일리 오피니언 표본설계: 무선전화 RDD (2020)
전화조사의 콜백(callback)이란 무엇인가 (2020)
무선전화 RDD, 가상번호, 알뜰폰: 이용자 특성과 성향 분석 (2022)

──
1) 현재 중앙선거관리위원회 선거여론조사 기준에 따른 응답률은 접촉자 중 응답성공률, 즉 협조율이다. 학술적으로 응답률은 조사대상 중 접촉성공률과 협조율을 포괄하는 개념이며, 2020년부터는 선거여론조사 기준 변경에 따라 응답률(협조율임)과 별도로 접촉성공률을 공개한다.