데이터 마이닝 실습
- 등록일 / 수정일
- 페이지 / 형식
- 자료평가
- 구매가격
- 2013.02.20 / 2019.12.24
- 15페이지 / hwp (아래아한글2002)
- 평가한 분이 없습니다. (구매금액의 3%지급)
- 1,700원
최대 20페이지까지 미리보기 서비스를 제공합니다.
자료평가하면 구매금액의 3%지급!
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
추천 연관자료
- 목차
-
1. 모델 선택 기준
-Validation Set의 오분류율
2. 모델 선택(Seed1)
-Tree
3. 분석(Seed1)
4. 평가(Seed1)
- Regression / Tree / Neural Network
5. 분석(Seed3)
6. 모델 선택(Seed3)
-Tree
7. 평가(Seed3)
- Regression / Tree / Neural Network
- 본문내용
-
1. 모델 선택 기준
1) 로지스틱 회귀분석
해당 자료는 타겟 변수가 당뇨병의 여부를 나타내는 범주형이다. 따라서 logstic 회귀분석을 통해 변수를 선택한다. 변수를 선택하는 방법으로는 Stepwise 방법을 사용한다.
변수 선택의 방법에는 Forward. Backward, Stepwise가 있다. Forward의 경우에는 한 번 선택된 변수가 제거되지 않는 단점이 존재하고, Backward는 한 번 제외된 변수의 재선택이 불가하고 변수 개수가 많을 경우 다루기 힘들다는 단점이 존재한다. 따라서 Forward 와 Backward 의 방법을 동시에 갖는 매단계마다 선택과 제거를 반복하는 Stepwise 방법을 사용하기로 한다.
2) Tree
Tree를 통한 분석에서 모델은 몇 가지 방법에 의해 평가되는데 그 기준이 되는 방법에는
Entropy 지수, Gini 지수, 카이제곱 통계량, Deviance 등 이 있다. 어떤 기준을 선택하여 Tree 분석을 할지 결정키 위해 위의 기준들을 이용해 반복적으로 오분류율을 구해보았다.
자료평가
-
아직 평가한 내용이 없습니다.
오늘 본 자료
더보기
최근 판매 자료
- [회계원칙] 회계원칙의 의의와 기본전제, 회계정보의 특성, 자산측정기준, 회계관습
- 생산관리_다음 프로젝트의 활동과 활동시간을 보고 1) 프로젝트네트워크를 작성하시오 2) 활동들의 시간을 구하시오 3) ES, EF, LS, LF 를 구하시오 4) 여유시간(ST)을 구하고 주경로를 결정하시오
- 기업커뮤니케이션 성공사례
- [경영조직론] 멀티콤 사례분석
- 국제경영_지역경제통합이란 무엇인가
- INTERPARK경영 INTERPARK창업 배경과 성장 스토리
- [생산관리] 신제품개발 KT&G `ZEST`
- 오뚜기라면 신제품 개발전략-우유라면
- [생산관리와 SCM] 신제품개발
- [생산운영관리] 신제품 개발 -매운 라면인 팔도 `남자라면`을 중심으로
저작권 관련 사항 정보 및 게시물 내용의 진실성에 대하여 레포트샵은 보증하지 아니하며, 해당 정보 및 게시물의 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 위 정보 및 게시물 내용의 불법적 이용, 무단 전재·배포는 금지됩니다. 저작권침해, 명예훼손 등 분쟁요소 발견시 고객센터에 신고해 주시기 바랍니다.