(SEM Final Project) 결측 패턴(MCAR, MAR, MNAR)파악에 대한 SEM의 활용

  • 등록일 / 수정일
  • 페이지 / 형식
  • 자료평가
  • 구매가격
  • 2015.03.29 / 2015.03.29
  • 7페이지 / fileicon hwp (아래아한글2002)
  • 평가한 분이 없습니다. (구매금액의 3%지급)
  • 1,000원
다운로드장바구니
Naver Naver로그인 Kakao Kakao로그인
최대 20페이지까지 미리보기 서비스를 제공합니다.
자료평가하면 구매금액의 3%지급!
이전큰이미지 다음큰이미지
본문내용
(SEM Final Project)
결측 패턴(MCAR, MAR, MNAR)파악에 대한 SEM의 활용
A comparison of Missing Data Methods on Statistical Influence in Latent Growth Modeling
(Shin, 2006)-replication
1. 연구의 목적 및 필요성
모수통계 이론에 근거하여 양적연구를 진행함에 있어 안정적이고 비 편향적(Unbiased)인 결과를 얻기 위한 기본적인 가정으로는 크게 세 가지가 있다. 적정 수 이상의 표본, 다변량 정규분포를 따르는 측정변인, 결측치가 없는 완전한 자료가 그것이다. 이 중 결측치가 없는 완전한 자료는 기존의 Raw Data를 가공하여 얻을 수는 있지만 Raw Data 자체로는 거의 불가능하다고 볼 수 있다. 하지만 문제는, 전통적으로 모수추정을 위한 통계모형들은 결측이 없는 완전자료를 가정한다는 점이다. 다시 말해 우리가 항상 이용하는 종단자료(KELS나 KEEP, KYPS등)는 필수적으로 결측치를 내포할 수 밖에 없다는 것이다. 특히, 시간이 지남에 따라 참가자가 중도 탈락하여 발생하는 결측이 일어날 가능성이 있고 일정 기간 동안 누락되었다가 다시 나타나는 패턴(Intermittent Pattern)도 발견될 수 있다. Head Start Program을 진행했던 미국의 경우 막대한 자본을 투입하여 실험의 상황을 통제할 수 있는 환경이 마련되었음에도 표본의 이탈과 결측의 빈번한 발생으로 결국 데이터 상에서 결측의 필연적 발생이 발견될 수 밖에 없었다는 것도 비실험적 상황이나 실험적 상황이나 결측은 피해갈 수 없는 요소임을 시사한다.
만약, 이러한 결측치에 대한 고려 없이 분석을 진행하면 어떤 상황을 초래할까? 물론 결측치가 완벽하게 무선으로 발생했을 경우 모집단에서 추출된 표본처럼 결측 자체를 제외하고 분석을 진행해도 아무 문제가 발생하지 않겠지만 이 이외에는 검증결과에 문제가 있다는 것이 일반적인 결론이다. 사실, 최근에는 MCAR(Missing Completely At Random)이라 하더라도 Listwise Deletion(완전 제거법)으로 결측 처리를 했을 때 공분산 구조를 왜곡하여 추정하거나 표준오차의 결과가 편향될 가능성이 높다는 연구가 있다(Duncan, 1998). 이렇듯 결측의 형태에 관한 엄밀한 분석이 분석을 진행함에 있어 정도 높은 추정치에 한 발자국 다가설 수 있음을 알 수 있다. 다행히도, 근래에 들어 SEM을 통해 MCAR, MAR, MNAR의 특성을 구분할 수 있는 모형이 다수 발견되고 발전됨에 따라 결측 패턴의 구분을 명확히 할 수 있게 되었다.
본 연구는 A comparison of Missing Data Methods on Statistical Influence in Latent Growth Model (Shin, 2006) 논문의 Replication판이라고 할 수 있다. 다만, 이 논문에서 사용한 완전자료, MCAR 자료, MNAR, MAR자료를 본 연구에서 사용하지는 않았다. 즉, Simulation적인 부분이 아닌 실제 우리가 사용하는 데이터(KELS)를 이용하여 결측 패턴을 구분해 보고 이로 인한 시사점을 도출해 냈다는 점에서 본 연구는 큰 의미가 있다. 구체적으로, 원래 연구에서 밝혔던 결측 패턴 차이가 실제 데이터에서는 어떠한 특성으로 나타나는지에 대한 관찰이 본 연구의 주안점이며 특히, MNAR자료와 MAR자료를 구분해 보는 수행을 통해 분석에 있어 연구자에게 시사점을 제공해준다.
2. 이론적 논의
2-1) 결측 매커니즘(Missing Mechanism)
결측 매커니즘에 대해 대부분의 학자들은 세 가지로 분류하고 있다. 첫 번째 유형은 완전히 무선적으로 결측이 일어나는 MCAR이다. MCAR에서는 결측 반응의 확률이 연구에서 사용되는 모든 측정 변인과 독립적이어야 한다. 예를 들어, 소득이 높거나 낮은 사람이 의도적으로 소득에 대한 보고를 누락시키거나 지역에 따라 학업 성취도 결과가 누락되는 경우 결측히 해당변인 또는 다른 공변인/독립 변인들과 관련되어 있으면 MCAR이라고 볼 수 없다. 두 번째 경우는 MAR(Missing At Random)이며 이를 무시할 수 있는 무반응(Ignorable Response)이라고도 한다. 즉, 결측 확률이 해당 변인과는 상관 없으나 다른 관찰 변인과의 관계는 존재할 수 있다는 것이다. 가령 세금에 대해 보고해야 하는 설문이 있을 때 하위, 중위층의 응답자의 경우 세금에 대해 보고할 가능성이 크지만 자신의 세금에 대해 노출되기를 꺼려하는 상위층의 응답자의 경우 자신의 경제적 지위에 따라 세금의 보고에서 결측을 유발하므로 이는 MAR의 일례로 볼 수 있다. 마지막으로 무선적으로 발생하지 않는 결측 매커니즘인 MNAR(Missing Not At Random)이 있다. 이를 무시할 수 없는 무반응(Non-Ignorable Response)이라고도 지칭하며, 결측 자체가 해당 변인과의 밀접한 관계 하에서 발생되는 것이다. 가령, 학업 성취도가 낮은 학생들은 자신의 학업 성취도를 묻는 문항에 대답하기를 부끄러워하여 누락시키는 경우가 있다. 이는 학업 성취 자체가 그 항목의 결측을 유발하는 원인이 되므로 MNAR의 결측패턴을 보인다고 말할 수 있다.
이 MNAR의 특징 중 주목할 만한 특징이 두 가지가 존재하는데, 첫 번째로는 MNAR은 MAR의 성격도 포함한다는 것이다. 소득의 누락이 소득 자체가 매우 높거나 낮아서 발생하는 소득 변인 자체의 특성에 근거하여 결측이 생기는 경우 뿐 아니라 소득 변인의 결측이 인종이나 교육 수준 등 기타 변인과도 관계가 있는 MAR의 성격도 포함하는 것이다. 두 번째로 실제 연구에서 결측 자료가 MNAR를 따른다고 증명하는 것이 거의 불가능하다(Laird, 1988; Rubin, 1987). MNAR 매커니즘은 결측 확률과 반응이 해당 변인의 특성 때문에 발생하는 것인데 현실 연구에서의 결측값으로 미지의 실제값으로 어떻게 결측 반응이 해당 변인과 관계가 있다고 주장할 수 있냐는 것이다.
통계적 정의를 바탕으로 세 가지 결측 매커니즘은 명확히 구분될 수 있으나 특정 결측자료의 결측매커니즘이 MCAR인지 MAR인지 MNAR인지 구분하는 것은 매우 힘들다. Shin(2013)의 연구에서는 관심 변인 Y의 결측 유무에 따라 이분형 변인(Missing=1, Not Missing=0)을 생성하고 이 변인과 다른 독립변인과의 상관이 없으면 MCAR, 있다면 MAR이라고 구분을 시도하였다. Raykov, Lichtenberg, Paulson(2012)의 연구에서는 완전 자료와 불완전 자료의 구성원 집단 간 보조변인 평균과 분산 차이가 통계적으로 유의미하지 않으면 MCAR로 규정할 수 있다고 했다. 문제는 결측 매커니즘이 MAR인지 MNAR인지 구분하기가 어려운 데 있다. 위에서 이야기했듯, MNAR은 MAR의 특성을 갖고 있으면서도 실제 연구에서 검증하기 어려운 특성을 포함하고 있기 때문이다. 특히, 전년도 점수가 올해의 점수에 영향을 미치는 종단연구의 구조의 경우 MNAR과 MAR의 차이가 사라질 가능성도 존재한다. MAR의 경우 분석을 진행 했을 시 편의가 크진 않지만 MNAR의 경우 상당히 위험한 편의를 유발할 수 있으므로 이 같은 경우 종단 데이터를 활용한 여러 연구의 신뢰성에 의문이 제기될 수 있다. 결국, MNAR과 MAR의 구분을 해줘야할 연구의 당위성이 생긴다.
2-2) MNAR 결측자료 분석모형
① 패턴 혼합 모형(Pattern Mixture Modeling)
자료평가
    아직 평가한 내용이 없습니다.
회원 추천자료
  • [교육사회학]우리 나라 영재교육 진단 및 발전방향
  • 결정적이다. 뷰모들은 교실에서 교사들을 보조하며 자신의 자녀가 집에서도 프로그램 활동을 하도록 촉진하다.외에도 장애아를 위한 프로그램으로서 개방적인 교실접근과는 대조적인 교사주도적인 활동을 하는 구조화된 교실 접근도 포함한 ‘RAPYHT Program 이 있다.4)학부모를 교사로 활용하는 프로그램메릴랜드 주의 볼티모어에 있는 Dundalk Community대학의 ‘project L-E-A-P(Learning and Enrichment for Able Preschoolers)는 4~6세아를 위한 프로그램이다. 이 프로그램

  • [영어§자기소개서, 이력서, 인터뷰§]영문이력서, 영어자기소개서, 영어인터뷰 - 완전판
  • 대한 매칭시킵니다. - 구인 광고의 (QUALIFICATION)의모든 문구를 활용해 당신이 적임자임을 알립니다. - 업무 내용을 항목별로 정리해서 일목요연하게 보여 줍니다 > ② EXPERIENCE 적는 법 - 회사가 필요하는 경력의 내용을 먼저 정확하게 파악합니다. - 구인 회사의 필요를 충족시키는 방향으로 경력을 기술합니다. - 경력을 구인 회사의 눈에 잘 보이도록 일목요연하게 정리합니다. - 경력은 반듯이 업적과 결과를 명시합니다. ③ 구체적으로 명시할 정보

  • 도 시 이 론 레포트
  • 결합한 패턴이 채용되었다. 이 두 개의 선 교차점에는 공지를 확보하여 여기에다 정부기관을 포함한 중요건물을 군적(群的)으로 건립하였다.방사선가로중최대로 큰 것은 길이 1.6 km, 폭 121m가 있고 가로율은 42%에 달하여 도시의 모델케이스가 되어 있다. 전체적으로 신생국 기상이 넘치는 위엄이 있지만 대각선으로 인하여 토지이용상 불합리한3각지가 생겨 결함으로 지적되고 있다.그림 3-41 워싱턴3)격자형 도시의 출현엘리코트(J. Ellicot)가 계획한 버

  • [전략경영] 디지털시대에 대응하는 삼성전기의 경영전략
  • 측면에서도 독립성을 유지하고 있다. 특히 내부신고제도(내부신고자 보호제도) 구축 및 운영으로 보다 객관적이고 엄밀한 감사업무 제고 노력은 모범적인 사례로 꼽히고 있다.’위의 글은 모신문사에 게재된 기사의 일부분이다. 기사에서 알 수 있듯이 삼성전기는 조직문화를 위해서도 상당한 노력을 하는 것을 알 수 있다. 구체적으로 살펴보면 우선 그룹의 ‘1등주의’ 문화 도입을 위해 각계각층에서 인력을 영입하고 서로 조화를 이룰 수 있도록

  • 스페인어 레포트
  • 결과 자신의 출신국가에서 사용하던 스페인어의 특징을 간직하는 경향이 강하다.10.1. 어휘에 끼친 영어의 영향많은 영어 어휘들이 스페인어 음성체계에 적응되어 변화되었으며 영어의 원뜻을 그대로 유지하고 있다. 다음에 드는 예들은 영어에서 온 차용어들(préstamos)로써 영어의 발음을 스페인어에서 그대로 유지하려고 한 것을 알 수 있다.telefón(telephone), gasolín(gasoline), balún(baloon), bisnes(business), brecas(brakes),cruque(crook), bil(bill), nicle(nickle), magazín(mag

오늘 본 자료 더보기
  • 오늘 본 자료가 없습니다.
  • 저작권 관련 사항 정보 및 게시물 내용의 진실성에 대하여 레포트샵은 보증하지 아니하며, 해당 정보 및 게시물의 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 위 정보 및 게시물 내용의 불법적 이용, 무단 전재·배포는 금지됩니다. 저작권침해, 명예훼손 등 분쟁요소 발견시 고객센터에 신고해 주시기 바랍니다.
    사업자등록번호 220-06-55095 대표.신현웅 주소.서울시 서초구 방배로10길 18, 402호 대표전화.02-539-9392
    개인정보책임자.박정아 통신판매업신고번호 제2017-서울서초-1806호 이메일 help@reportshop.co.kr
    copyright (c) 2003 reoprtshop. steel All reserved.