[데이터마이닝] DM Fundraising
- 등록일 / 수정일
- 페이지 / 형식
- 자료평가
- 구매가격
- 2011.11.17 / 2019.12.24
- 99페이지 / hwp (아래아한글2002)
- 평가한 분이 없습니다. (구매금액의 3%지급)
- 2,800원
최대 20페이지까지 미리보기 서비스를 제공합니다.
자료평가하면 구매금액의 3%지급!
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
추천 연관자료
- 목차
-
< 목 차 >
Ⅰ. 서론
1. 소개
2. 목적설정하기
① 프로젝트 목적설정
② 모형구축방법 선택
Ⅱ. 본론
1. 데이터 선택
(1) 데이터의 종류
(2)변수설명
(3)자료 분석
2. 모형구축을 위한 데이터 준비
(1) 데이터 접근하기
(2) 데이터 정제하기
1). 연속형 변수
①. 이상치와 데이터 오류
2) 범주형 변수
3. 변수 선택 및 변환
(1) 새로운 변수(비율) 만들기
(2) 변수 선택하기
1) 연속형 변수
2) 범주형 변수
(3) 선형적인 독립변수(predictors) 개발하기
1)연속형 변수
① 변수세분화(Segmentation)
②. 변수변환(Segmentation)
2) 범주형 변수
5. 모형 구축 과정 및 평가
1) 데이터 나누기
2)모형구축하기
①단계적선택방법
②후진소거법
③최적조합선택법
3) 평가(십분위 분석법)
①분석용데이터세트
② 평가용데이터세트
6. 모형평가
1) 분석용 데이터 세트 이익도표
2) 평가용 데이터 세트 이익도표
Ⅲ. 결론
- 본문내용
-
Lift값을 보면 십분위 0에서는 평균보다 실제 활성화된 관찰치를 1.86배 더 포함하고 있다. 십분위 4(1.22배)까지는 구축된 모형이 평균모형보다 더 좋음을 알 수 있다. 누적Lift를 보면 십분위 4까지의 모형의 적합도는 모형 구축을 하지 않았을 때 또는 평균 모형보다 62% 정도 더 적합하다는 것을 알 수 있다.
training set
이 그래프는 이익도표를 그래프로 나타낸 것으로 모형구축을 하지 않았을 때보다 모형을 구출하는 것이 얼마나 더 적합한지를 확연히 알 수 있게 해준다. 전체 데이터의 50% 만으로도 활성화 관찰치들 중 83%를 찾을 수 있다. 모형을 구축하지 않았을 때보다 63% 더 증가한 것이다.
test set
이 그래프는 이익도표를 그래프로 나타낸 것으로 모형구축을 하지 않았을 때보다 모형을 구출하는 것이 얼마나 더 적합한지를 확연히 알 수 있게 해준다. 전체 데이터의 50% 만으로도 활성화 관찰치들 중 82%를 찾을 수 있다. 모형을 구축하지 않았을 때보다 62% 더 증가한 것이다.
<결론수정>
자료평가
-
아직 평가한 내용이 없습니다.