국외교육훈련

Overseas Training

게시판
훈련과정 과장급직무훈련 훈련국 미국
훈련기관 Institute for Social Research, University of Michigan 훈련기간 2017.08.26 ~ 2018.08.25
훈련과제명 빅데이터를 활용한 조사모집단 구축 및 적응적 표본설계 방안 연구
보고서제목 빅데이터를 활용한 조사모집단 구축 및 적응적 표본설계 방안 연구
추천 0
최근 행정자료 활용은 조사통계에 많은 변화를 가져왔다. 행정자료를 이용하여 자료를 조사함 없이 직접 통계를 생산하거나, 조사통계와 연계하여 보다 높은 부가가치를 창출하려는 움직임이 활발하다. 행정자료는 우선 저비용이며, 높은 커버리지를 가지며 또한 응답부담이 없으며 응답오차가 없다는 장점을 지니고 있다. 다만 행정자료의 이러한 매력에도 자료가 정제되어 있지 않고 행정을 위해 필요한 대상만이 수집될 가능성이 높으며 개인정보와 관련하여 비밀보호(confidentiality)가 요구된다. 다만 최근 전 세계적으로 조사비용 절감 및 통계생산의 효율성이 강조됨에 따라 여러 행정자료를 수집하여 연계하는 작업이 점차 보편화되고 있다.

무엇보다 행정자료가 표본조사에서 가장 중요한 역할은 매년 최신의 표본추출틀(sampling frame)을 구축할 수 있다는 것이다. 표본추출틀의 노후화는 적정한 표본을 뽑지 못하여 조사의 대표성 및 정확성을 저하시키는 결과를 가져온다. 표본추출틀을 최신의 정확한 개별단위(인구, 가구, 주택 등)로 구축함으로써 다양한 추출단위(리스트, 영역) 및 추출방법 등 표본설계, 무응답 조정 및 사후층화에 적용이 가능하여 보다 정확한 통계생산을 가능하게 한다. 미국의 사례를 보면 표본추출틀은 우편국 행정자료를 통해 매년 마스터 주소록(master address file)을 구축하고 지리정보 시스템과 연계한다. 여기에 주택변수 및 가구변수를 추가해서 매년 미국 인구조사(ACS) 및 다른 조사의 표본추출틀로 사용하고 있다.
본 보고서는 조사에서 발생되는 무응답을 행정자료 등을 통해 통계적으로 보완하는 방법에 중점을 두어 다룬다.

가구표본조사에서 어떠한 이유에서든 무응답은 필연적으로 수반할 수밖에 없다. 대부분 무응답은 비접촉과 응답거부 형태로 이루어진다. 조사특성상 조사기간이 짧은 표본조사의 경우 1인가구나 맞벌이 가구 증가에 따른 주간부재는 무응답에 큰 영향을 미치고 있다. 사회조사는 이러한 무응답에 관한 문제를 제거하기 위해 조사현장에서 표본대체(substitution) 방법을 사용해 왔다. 하지만 표본대체 방법은 선택편향 및 특정 계층에서 체계적 오차 발생 등에 대한 오랜 논란이 있어, 이를 불식시키기 위해 2016년 조사부터는 무응답에 대한 탐색 및 처리를 위한 새로운 방법을 도입했다. 무응답 처리를 위해 필수적으로 필요한 보조정보(auxiliary information)를 파라데이터(paradata)와 행정자료로 부터 확보가 가능했기 때문이다. 이 연구에서는 사회조사에 적합한 무응답 처리 방법을 위해 모의실험을 전개하였다.

2016년 사회조사 결과를 준모집단(pseudo-population)으로 간주하여 일부 표본자료를 300회 추출하고, 여기에서 6가지 무응답 메커니즘에 따라 무응답을 발생시키고 나서 가중값 조정법을 통해 무응답을 처리한다. 무응답 처리를 위해서는 무엇보다 응답성향과 관련 있고 동시에 조사변수와 연관성 높은 보조정보 구성이 중요하다. 보조정보 구성은 무응답 편향, 분산, 설계효과 등에 직접적 영향을 미치고 있음을 확인 할 수 있었다. 무응답 처리결과를 보면, 주요 조사변수와 관련성이 높은 파라데이터와 행정자료로부터 통합자료를 보조정보로 구성한 경우에 무응답 처리에 높은 효과를 보였다.

최근 무응답 동향을 보면 우리나라 뿐 아니라 전 세계적으로 증가를 보이고 있다. 응답을 시작했으나 도중에 응답을 그만 두는 부분 무응답, 조사 자체를 거부하는 응답거부, 조사기간 동안 접촉이 불가능한 경우 등 다양한 이유로 무응답이 발생된다. 무응답을 줄이는 방법으로 조사 시작 전에 사전안내문을 보내는 것과 조사협조를 위한 답례품 제공, 설문지를 쉽게 구성 및 경험이 풍부한 조사원 활용하는 법 등이 있다. 조사 설계자와 현장담당자의 무응답 축소를 위한 노력에도 조사환경은 더욱 악화되어 무응답 증가는 지속될 것으로 전망된다. 현장에서 더 이상 처리되지 않는 무응답은 통계적인 방법을 이용해 처리하여 무응답 편향을 줄일 수 있다.

통계적인 방법을 통해 무응답 효과를 축소하기 위해서는 응답 뿐 아니라 무응답에 대한 정보를 포함한 보조정보(auxiliary information)의 확보가 매우 중요하다. 이러한 보조정보의 한 축이 행정자료를 통해 확보가 가능하다. 유용한 행정자료 확보는 무응답 편향을 크게 축소하여 통계의 정확성을 보장할 수 있다. 이를 위해 관련 조사와 무응답과 관련성이 높은 행정자료에 대한 적극적인 수집이 요구된다.
첨부파일