(SEM Final Project) 결측 패턴(MCAR, MAR, MNAR)파악에 대한 SEM의 활용
- 등록일 / 수정일
- 페이지 / 형식
- 자료평가
- 구매가격
- 2015.03.29 / 2015.03.29
- 7페이지 / hwp (아래아한글2002)
- 평가한 분이 없습니다. (구매금액의 3%지급)
- 1,000원
최대 20페이지까지 미리보기 서비스를 제공합니다.
자료평가하면 구매금액의 3%지급!
1
2
3
4
5
6
7
추천 연관자료
- 본문내용
-
(SEM Final Project)
결측 패턴(MCAR, MAR, MNAR)파악에 대한 SEM의 활용
A comparison of Missing Data Methods on Statistical Influence in Latent Growth Modeling
(Shin, 2006)-replication
1. 연구의 목적 및 필요성
모수통계 이론에 근거하여 양적연구를 진행함에 있어 안정적이고 비 편향적(Unbiased)인 결과를 얻기 위한 기본적인 가정으로는 크게 세 가지가 있다. 적정 수 이상의 표본, 다변량 정규분포를 따르는 측정변인, 결측치가 없는 완전한 자료가 그것이다. 이 중 결측치가 없는 완전한 자료는 기존의 Raw Data를 가공하여 얻을 수는 있지만 Raw Data 자체로는 거의 불가능하다고 볼 수 있다. 하지만 문제는, 전통적으로 모수추정을 위한 통계모형들은 결측이 없는 완전자료를 가정한다는 점이다. 다시 말해 우리가 항상 이용하는 종단자료(KELS나 KEEP, KYPS등)는 필수적으로 결측치를 내포할 수 밖에 없다는 것이다. 특히, 시간이 지남에 따라 참가자가 중도 탈락하여 발생하는 결측이 일어날 가능성이 있고 일정 기간 동안 누락되었다가 다시 나타나는 패턴(Intermittent Pattern)도 발견될 수 있다. Head Start Program을 진행했던 미국의 경우 막대한 자본을 투입하여 실험의 상황을 통제할 수 있는 환경이 마련되었음에도 표본의 이탈과 결측의 빈번한 발생으로 결국 데이터 상에서 결측의 필연적 발생이 발견될 수 밖에 없었다는 것도 비실험적 상황이나 실험적 상황이나 결측은 피해갈 수 없는 요소임을 시사한다.
만약, 이러한 결측치에 대한 고려 없이 분석을 진행하면 어떤 상황을 초래할까? 물론 결측치가 완벽하게 무선으로 발생했을 경우 모집단에서 추출된 표본처럼 결측 자체를 제외하고 분석을 진행해도 아무 문제가 발생하지 않겠지만 이 이외에는 검증결과에 문제가 있다는 것이 일반적인 결론이다. 사실, 최근에는 MCAR(Missing Completely At Random)이라 하더라도 Listwise Deletion(완전 제거법)으로 결측 처리를 했을 때 공분산 구조를 왜곡하여 추정하거나 표준오차의 결과가 편향될 가능성이 높다는 연구가 있다(Duncan, 1998). 이렇듯 결측의 형태에 관한 엄밀한 분석이 분석을 진행함에 있어 정도 높은 추정치에 한 발자국 다가설 수 있음을 알 수 있다. 다행히도, 근래에 들어 SEM을 통해 MCAR, MAR, MNAR의 특성을 구분할 수 있는 모형이 다수 발견되고 발전됨에 따라 결측 패턴의 구분을 명확히 할 수 있게 되었다.
본 연구는 A comparison of Missing Data Methods on Statistical Influence in Latent Growth Model (Shin, 2006) 논문의 Replication판이라고 할 수 있다. 다만, 이 논문에서 사용한 완전자료, MCAR 자료, MNAR, MAR자료를 본 연구에서 사용하지는 않았다. 즉, Simulation적인 부분이 아닌 실제 우리가 사용하는 데이터(KELS)를 이용하여 결측 패턴을 구분해 보고 이로 인한 시사점을 도출해 냈다는 점에서 본 연구는 큰 의미가 있다. 구체적으로, 원래 연구에서 밝혔던 결측 패턴 차이가 실제 데이터에서는 어떠한 특성으로 나타나는지에 대한 관찰이 본 연구의 주안점이며 특히, MNAR자료와 MAR자료를 구분해 보는 수행을 통해 분석에 있어 연구자에게 시사점을 제공해준다.
2. 이론적 논의
2-1) 결측 매커니즘(Missing Mechanism)
결측 매커니즘에 대해 대부분의 학자들은 세 가지로 분류하고 있다. 첫 번째 유형은 완전히 무선적으로 결측이 일어나는 MCAR이다. MCAR에서는 결측 반응의 확률이 연구에서 사용되는 모든 측정 변인과 독립적이어야 한다. 예를 들어, 소득이 높거나 낮은 사람이 의도적으로 소득에 대한 보고를 누락시키거나 지역에 따라 학업 성취도 결과가 누락되는 경우 결측히 해당변인 또는 다른 공변인/독립 변인들과 관련되어 있으면 MCAR이라고 볼 수 없다. 두 번째 경우는 MAR(Missing At Random)이며 이를 무시할 수 있는 무반응(Ignorable Response)이라고도 한다. 즉, 결측 확률이 해당 변인과는 상관 없으나 다른 관찰 변인과의 관계는 존재할 수 있다는 것이다. 가령 세금에 대해 보고해야 하는 설문이 있을 때 하위, 중위층의 응답자의 경우 세금에 대해 보고할 가능성이 크지만 자신의 세금에 대해 노출되기를 꺼려하는 상위층의 응답자의 경우 자신의 경제적 지위에 따라 세금의 보고에서 결측을 유발하므로 이는 MAR의 일례로 볼 수 있다. 마지막으로 무선적으로 발생하지 않는 결측 매커니즘인 MNAR(Missing Not At Random)이 있다. 이를 무시할 수 없는 무반응(Non-Ignorable Response)이라고도 지칭하며, 결측 자체가 해당 변인과의 밀접한 관계 하에서 발생되는 것이다. 가령, 학업 성취도가 낮은 학생들은 자신의 학업 성취도를 묻는 문항에 대답하기를 부끄러워하여 누락시키는 경우가 있다. 이는 학업 성취 자체가 그 항목의 결측을 유발하는 원인이 되므로 MNAR의 결측패턴을 보인다고 말할 수 있다.
이 MNAR의 특징 중 주목할 만한 특징이 두 가지가 존재하는데, 첫 번째로는 MNAR은 MAR의 성격도 포함한다는 것이다. 소득의 누락이 소득 자체가 매우 높거나 낮아서 발생하는 소득 변인 자체의 특성에 근거하여 결측이 생기는 경우 뿐 아니라 소득 변인의 결측이 인종이나 교육 수준 등 기타 변인과도 관계가 있는 MAR의 성격도 포함하는 것이다. 두 번째로 실제 연구에서 결측 자료가 MNAR를 따른다고 증명하는 것이 거의 불가능하다(Laird, 1988; Rubin, 1987). MNAR 매커니즘은 결측 확률과 반응이 해당 변인의 특성 때문에 발생하는 것인데 현실 연구에서의 결측값으로 미지의 실제값으로 어떻게 결측 반응이 해당 변인과 관계가 있다고 주장할 수 있냐는 것이다.
통계적 정의를 바탕으로 세 가지 결측 매커니즘은 명확히 구분될 수 있으나 특정 결측자료의 결측매커니즘이 MCAR인지 MAR인지 MNAR인지 구분하는 것은 매우 힘들다. Shin(2013)의 연구에서는 관심 변인 Y의 결측 유무에 따라 이분형 변인(Missing=1, Not Missing=0)을 생성하고 이 변인과 다른 독립변인과의 상관이 없으면 MCAR, 있다면 MAR이라고 구분을 시도하였다. Raykov, Lichtenberg, Paulson(2012)의 연구에서는 완전 자료와 불완전 자료의 구성원 집단 간 보조변인 평균과 분산 차이가 통계적으로 유의미하지 않으면 MCAR로 규정할 수 있다고 했다. 문제는 결측 매커니즘이 MAR인지 MNAR인지 구분하기가 어려운 데 있다. 위에서 이야기했듯, MNAR은 MAR의 특성을 갖고 있으면서도 실제 연구에서 검증하기 어려운 특성을 포함하고 있기 때문이다. 특히, 전년도 점수가 올해의 점수에 영향을 미치는 종단연구의 구조의 경우 MNAR과 MAR의 차이가 사라질 가능성도 존재한다. MAR의 경우 분석을 진행 했을 시 편의가 크진 않지만 MNAR의 경우 상당히 위험한 편의를 유발할 수 있으므로 이 같은 경우 종단 데이터를 활용한 여러 연구의 신뢰성에 의문이 제기될 수 있다. 결국, MNAR과 MAR의 구분을 해줘야할 연구의 당위성이 생긴다.
2-2) MNAR 결측자료 분석모형
① 패턴 혼합 모형(Pattern Mixture Modeling)
자료평가
-
아직 평가한 내용이 없습니다.
오늘 본 자료
더보기
최근 판매 자료
- [생산운영관리] TQM 세부사례(페덱스 도요타 제록스 포스코)
- [인적자원관리] 한국도로공사로 알아본 공기업의 현황과 문제점과 개선방안
- [한국도로공사 기업분석]한국도로공사 경영전략분석 PPT자료
- [생산운영관리] IKEA(이케아)의 생산운영 사례 분석(영문)
- 시장조사론_외생변수란 무엇이며, 왜 문제가 되는지 강의내용을 중심으로 작성하시오
- 소비자심리학_코로나가 발생하기 전과 후의 소비자 심리의 변화를 자신의 구매행동을 사례를 들어 작성하세요
- [마케팅전략] 아디다스 전략적 분석 및 지속성장을 위한 제언
- 근현대 한국사회 발전과 갈등을 정치사와 경제사의 상호관련성 아래 분석하고, 이를 서구의 민주화 및 산업화와 비교하여 설명하시오
- [경영]페덱스 서비스경영
- [경영전략] 마이클 포터의 5 Force모델에 따른 미스터피자 분석
저작권 관련 사항 정보 및 게시물 내용의 진실성에 대하여 레포트샵은 보증하지 아니하며, 해당 정보 및 게시물의 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 위 정보 및 게시물 내용의 불법적 이용, 무단 전재·배포는 금지됩니다. 저작권침해, 명예훼손 등 분쟁요소 발견시 고객센터에 신고해 주시기 바랍니다.