2023년 2학기 방송통신대 베이즈데이터분석 기말과제물)밀도함수를 고려하자. 여기서 상수 이다. 다음의 질문에 답하시오. (a) 일 때, 상수 를 확률변수 의 기댓값으로 표현하시오 상수 를 (a)에서 표현한 식을 이용해서 몬테 카를로 방법으로 구하시오 등

  • 등록일 / 수정일
  • 페이지 / 형식
  • 자료평가
  • 구매가격
  • 2023.11.06 / 2023.11.06
  • 15페이지 / fileicon zip (압축파일)
  • est1est2est3est4est5 1(구매금액의 3%지급)
  • 20,000원
다운로드장바구니
Naver Naver로그인 Kakao Kakao로그인
최대 20페이지까지 미리보기 서비스를 제공합니다.
자료평가하면 구매금액의 3%지급!
이전큰이미지 다음큰이미지
방송통신대 과제물 정보
개설학과 통계데이터과학과 개설학년 4학년 교과목명 베이즈데이터분석
공통 1. (10점) 밀도함수

를 고려하자. 여기서 상수

이다. 다음의 질문에 답하시오.

(a) 일 때, 상수 를 확률변수 의 기댓값으로 표현하시오.
(b) 상수 를 (a)에서 표현한 식을 이용해서 몬테 카를로 방법으로 구하시오. 이 때, 몬테 카를로 표본의 개수는 를 이용하시오. 계산은 R을 이용하시오.
(c) (b)에서 구한 상수 값을 이용하여 밀도함수 의 그림을 R로 그리시오.

*** 자세한 문항은 방송통신대 공지사항 첨부파일 참조
하고 싶은 말
교재를 중심으로 다양한 문헌을 참고하여 정성을 다해 작성하였습니다.
(베이즈데이터분석.Rmd, 베이즈데이터분석.html, 베이즈데이터분석.pdf 첨부)

리포트 작성에 참고하시어 좋은 성적 받으세요.^^

행복하세요~
목차
1. (10점) 밀도함수 를 고려하자. 여기서 상수 이다. 다음의 질문에 답하시오.

(a) 일 때, 상수 를 확률변수 의 기댓값으로 표현하시오.
(b) 상수 를 (a)에서 표현한 식을 이용해서 몬테 카를로 방법으로 구하시오. 이 때, 몬테 카를로 표본의 개수는 를 이용하시오. 계산은 R을 이용하시오.
(c) (b)에서 구한 상수 값을 이용하여 밀도함수 의 그림을 R로 그리시오.

2. (20점) 다음은 1994년과 2014년 군에 입대하는 10명의 병사들의 몸무게를 잰 결과이다.
1994년: 65.9, 55.9, 43.8, 57.7, 68.8, 23.1, 85.4, 62.8, 65.2, 49.9 (kg)
2014년: 68.3, 85.7, 73.8, 83.2, 58.9, 7.27, 70.5, 58.7, 74.1, 75 (kg)

1994년 군에 입대한 병사들의 몸무게를 , 2014년 군에 입대한 병사들의 몸무게를 라 하고, 다음의 모형을 상정하자.

2014년 병사들의 몸무게의 평균과 1994년 병사들의 몸무게의 차이 에 대해 추론을 하고자 한다. 다음의 질문에 답하시오.

(a) 위 모형의 사후표본을 추출하기 위한 스탠과 R 코드를 작성하고 사후표본을 구하시오. 번인 5000개를 포함하여 총 15,000개의 사후표본을 추출하시오.
(b) 모수들의 시계열 그림, 자기상관계수 그림을 그리고 마르코프 체인이 수렴했는지 판단하시오. 수렴하지 않았다고 판단되면 수렴했다고 판단할 때까지 사후표본의 크기를 늘리시오.
(c) 의 사후표본의 히스토그램을 그리시오.
(d) 의 사후평균, 사후표준편차, 95% 신용구간을 구하시오.

3. (20점) 다음은 R의 mtcars 데이터의 일부분이다. 두변수 mpg(마일/갤론)과 hp(마력)을 각각 x1와 x2로 나타내었다.

두 변수 사이의 상관계수 에 대해 추론하고자 다음의 모형을 고려하자.

모수들의 사전분포는 다음과 같다고 하자.

다음의 질문에 답하시오.

(a) 위 모형의 사후표본을 추출하기 위한 스탠과 R 코드를 작성하고 사후표본을 구하시오. 번인 5000개를 포함하여 총 15,000개의 사후표본을 추출하시오.
(b) 모수들의 시계열 그림, 자기상관계수 그림을 그리고 마르코프 체인이 수렴했는지 판단하시오. 수렴하지 않았다고 판단하면 수렴했다고 판단할 때까지 사후표본의 크기를 늘리시오.
(c) 의 사후표본의 히스토그램을 그리시오.
(d) 의 사후평균, 사후표준편차, 95% 신용구간을 구하시오.

4. 참고문헌
본문내용
베이지안 추론의 핵심은 관측값이 주어졌을 때 모수 θ의 사후분포를 구하는 것이다. 그러나 모형이 복잡하거나 모수의 수가 많으면 θ를 수리적으로 구할 수 없다. 따라서 사후분포의 사후평균, 사후분산, 특정 사건에 대한 사후확률 등을 근사적으로 계산할 필요가 있다. 이때 사후분포의 특성을 근사적으로 구하기 위해 마르코프 체인 몬테칼로(Markov Chain Monte Carlo, MCMC) 기법이 많이 사용된다. MCMC 기법은 마르코프체인을 이용하여 사후분포로부터 표본을 생성하고 이 사후표본을 사용하여 사후추론을 수행하는 방법이다. 깁스 추출법, 메트로폴리스-헤이스팅스 알고리듬, 해밀턴 몬테 카를로 등이 대표적인 MCMC 기법이다.

단순한 모델의 경우 R의 기본적인 함수(lm, glm 등)를 사용하여 매개변수를 추정할 수 있고, 복잡한 모델의 경우에도 기존 R 패키지를 사용하면 문제를 해결할 수 있는 경우도 있다. 그러나 패키지와 함수별로 사용 방법이 달라서 이를 충분히 인지해야 하고, 패지지와 함수 중에서 적절한 모델을 찾는 노력도 중요하다. 특히 적절한 모델 지원이 되지 않는 경우에는 분석 자체를 진행할 수 없게 된다. 이처럼 R 패키지가 모델 확장성이 낮다는 단점에 대응하기 위해 등장한 것이 Stan, WinBUGS, JAGS 등의 확률적 프로그래밍 언어라고 할 수 있다.

Stan은 앤드류 겔만, 밥 카펜터, 대니얼 리 등이 2012년부터 깃허브에서 개발하고 있는 확률적 프로그래밍언어이다. WinBUGS나 JAGS처럼 사후분포에서 표본을 추출한다. R인터페이스인 rstan과 함께 python과 matlab 인터페이스도 공개되어 있다. Stan은 추정 계산 알고리즘으로 해밀토니안 몬테칼로(HMC)의 한 버전인 NUTS(No-U-Turn Sampler)를 사용한다.
참고문헌
이재용·이기재(2022), 베이즈 데이터 분석, 한국방송통신대학교출판문화원.
마쓰우라 겐타(2019), 데이터 분석을 위한 베이지안 통계 모델링 with Stan & R, 길벗.
존 크러슈케(2018), R, JAGS, Stan을 이용한 베이지안 데이터 분석 바이블 2판, 제이펍.
Stan User’s Guide(https://mc-stan.org/docs/stan-users-guide/index.html)
자료평가
  • 자료평가0자료평가0자료평가0자료평가0자료평가0
  • 코드에러로 해결하는데 고생함. 그래도 바탕이 있어서 쉬웠음.
  • 20739***
    (2023.11.27 09:53:28)
회원 추천자료
오늘 본 자료 더보기
  • 오늘 본 자료가 없습니다.
  • 최근 판매 자료
    저작권 관련 사항 정보 및 게시물 내용의 진실성에 대하여 레포트샵은 보증하지 아니하며, 해당 정보 및 게시물의 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 위 정보 및 게시물 내용의 불법적 이용, 무단 전재·배포는 금지됩니다. 저작권침해, 명예훼손 등 분쟁요소 발견시 고객센터에 신고해 주시기 바랍니다.
    사업자등록번호 220-06-55095 대표.신현웅 주소.서울시 서초구 방배로10길 18, 402호 대표전화.02-539-9392
    개인정보책임자.박정아 통신판매업신고번호 제2017-서울서초-1806호 이메일 help@reportshop.co.kr
    copyright (c) 2003 reoprtshop. steel All reserved.