[데이터 마이닝] 데이터 마이닝(문제정의 및 분석)

  • 등록일 / 수정일
  • 페이지 / 형식
  • 자료평가
  • 구매가격
  • 2009.07.01 / 2019.12.24
  • 23페이지 / fileicon hwp (아래아한글2002)
  • 평가한 분이 없습니다. (구매금액의 3%지급)
  • 1,500원
다운로드장바구니
Naver Naver로그인 Kakao Kakao로그인
최대 20페이지까지 미리보기 서비스를 제공합니다.
자료평가하면 구매금액의 3%지급!
이전큰이미지 다음큰이미지
하고 싶은 말
도움이 되었으면 좋겠네요^^
목차
Ⅰ. DATA MINING 정의···················································································2

1. 데이터 마이닝의 정의···················································································2
2. 데이터 마이닝 활용 분야··············································································2
3. 데이터 마이닝의 특징···················································································3
4. 데이터 마이닝 절차·························································································3
5. 적용 사례····································································································3

Ⅱ. 문제 정의 및 분석·························································································4

1. 문제설정······································································································4
2. 분석방법······································································································4
3. 풀이 및 분석································································································4
(1) data 입력································································································4
(2)Weka program··························································································7
(3) J48 Tree 알고리즘···················································································8
(4) Naivebayes 알고리즘··············································································10
(5) Cobwed 알고리즘···················································································13
(6) Associate 알고리즘················································································22


Ⅲ. 결론··············································································································23
본문내용
Ⅰ. DATA MINING 정의
1. 데이터 마이닝의 정의
많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다.
데이터베이스로부터 과거에는 알지 못했지만 데이터 속에서 유도된 새로운 데이터 모델을 발견하여 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다. 즉 데이터에 숨겨진 패턴과 관계를 찾아내어 광맥을 찾아내듯이 정보를 발견해 내는 것이다. 여기에서 정보 발견이란 데이터에 고급 통계 분석과 모델링 기법을 적용하여 유용한 패턴과 관계를 찾아내는 과정이다. 데이터베이스 마케팅의 핵심 기술이라고 할 수 있다.

2. 데이터 마이닝 활용 분야
- Prediction : 신용카드 거래에서 특정한 거래가 사기일 가능성을 예측하듯이 데이터를 통하여 만들어지 예측모형을 이용하여, 자료의 특정한 속성을 예측한다.

- Regression : 어떤 속성이 다른 속성에 의하여 설명되어지는 관계성을 분석하여, 새로운 사례에 대하여 이러한 속성치를 예측할 수 있는 모델을 구축한다. 예를 들면, 콜센터에서 콜의 빈도와 사용 코드 난이도의 관계성을 찾아 상담을 문의한 고객에게 문의 내용을 미리 예측하여 적절한 안내원이 응대할 수 있도록 한다.

- Classification : 일련의 범주들이 사전에 분류되어 있을 때, 특정한 데이터의 항목이 이러한 분류 체계 중 어디에 속하는 가를 결정한다. 예를 들면, 은행에서 직업과 학력에 따라 신용등급(양호, 보통, 불량)을 부여하고자 할 때, 새로운 고객의 신용등급을 그 고객의 직업과 학력에 따라 분류된다.

- Clustering : 데이터의 여러 속성들을 비교하여 유사한 특성을 갖는 항목들을 함께 묶는다. 군집분석은 유사한 항목들의 집단을 찾아내는데 가장 잘 사용된다. 예를 들면, 유사한 구매행동을 하는 고객들의 군집을 찾아내어 그 군집의 특성을 밝혀낸다.

- Association : 고객들의 거래 형태 데이터에서 서로 연관성이 있는 항목들의 특성을 찾아 Cross/Up selling을 위한 상품을 찾아낸다. 예를 들어 컴퓨터를 구매한 고객들 중에서 프린터를 구입하지 않은 고객들에게 프린터를 추천한다던가, 컴퓨터 교체 주기를 찾아 새로운 모델의 컴퓨터를 추천할 수 있을 것이다.

- Deviation detection : 데이터 중에서 다른 데이터와 구별되는 아주 특별한 속성을 갖고 있는 데이터를 찾아낸다. 앞의 여러 분야는 데이터로부터 일반적으로 적용될 수 있는 패턴을 찾는 것인데 비하여, Deviation detection은 아주 작은 비정상적인 데이터를 찾아내는 작업이다. 예로는, 신용카드 사기를 들 수 있는데, 전체 신용카드 사용 중 사기거래는 매우 극소수에 불과하기 때문이다.

- Model visuallization : 시각화는 발견된 지식을 이해 가능하게 하고 해석 가능하게 만드는 과정에 있어서 중요한 역할을 한다. 아무리 잘 정립된 규칙이라도 그 내용을 눈으로 보여주는 것 보다 빨리 이해시키기는 쉽지 않을 것이다. 시각화 기법으로는 단순한 산포도나 막대그래프로부터 3차원 영상에 이르기까지 다양하며, 특히 다차원 자료의 시각화를 위한 여러 가지 고난도의 방법들이 개발되고 있다.

- Exploratory Data Analysis(EDA) : 탐색적 데이터 분석(EDA)은 사전에 설정된 가정이나 모형에 의존하지 않고 데이터를 탐색하여 흥미 있는 패턴들을 밝히려고 시도한다. 시각과 직관을 위해 데이터의 그래픽 표현이 흔히 사용된다.
자료평가
    아직 평가한 내용이 없습니다.
회원 추천자료
  • 2017년 2학기 빅데이터의이해 중간시험과제물 공통(데이터과학자, 빅데이터, 빅데이터사례)
  • [mis, 경영정보시스템] 의사결정나무(decision tree)
  • 데이터로부터의 반복적인 학습 과정을 거쳐 패턴을 찾아내고 이를 일반화함으로써 특히 향후를 예측하고자 하는 문제에 있어서 유용하게 이용되는 기법이다.3. 의사결정나무의 정의의사결정나무(decision tree)는 의사결정 규칙을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 분류 하거나 예측을 수행하는 계량적 분석방법이고 가능한 모든 대안들과 각 대안에서 발생할 수 있는 불확실성 및 그 결과를 있는 그대로 그림으로 나타낸 것이다.

  • Business Intelligence 비즈니스 인텔리전스
  • 데이터 마이닝(supervised data mining)3) 데이터 마이닝 기술과 소프트웨어4) 보고서 매체 5) 보고서 모드6) OLAP(Online Analytical Processing)Ⅵ. Business Intelligence의 효과1) 쉽고 정확한 데이터 분석2) 신속한 의사결정 지원을 통한 기업 경쟁력 향상3) 비용절감 및 수익 창출4) 고객에 대한 관찰과 분석 수행Ⅶ. Business Intelligence 실제 사례1. 두산건설2. 삼양사3. 후지제록스4. 삼성전기5. 빙그레6. SK 텔레콤Ⅷ. Business Intelligence의 문제점 및 한계점Ⅸ. Business Intell

  • [데이터베이스] web mining 웹마이닝 보고서
  • 및 정보의 개인화 등의 문제가 대두되게 되었다. 이러한 문제들을 해소하기 위해 웹으로부터 정보를 얻을 수 있는 자동화된 툴이 필요하게 되었고, 얻은 정보를 이용하여 웹 사용자들의 패턴을 식별할 수 있는 방법 또한 필요하게 되었다.2. Web Mining의 정의웹 마이닝(Web Mining)이란 웹 환경에서 적용되어지는 데이터 마이닝 기술로 웹으로부터 얻어지는 방대한 양의 정보로부터 유용한 정보를 찾아내어 분석하는 것을 말한다. 즉, 웹 환경의 로그 파일로

  • [mis, 경영정보시스템] 의사결정나무(decision tree)
  • 문제발생 0.3성공적 운전1모형 T장치문제점 발생0모형 T장치모형 T장치성공적 운전0문제점 발생1문제점 발생0.3성공적 운전0.7성과50-2=4880-2=7830-2=2850-2=4880-2=7830-2=288030모형 X장치모형 X장치모형 X장치*7. 결론 의사나무기법은 계량적인 데이터에 근거한 분석기법으로써 다양한 분야에 활용되고 있음의사나무기법을 지원하는 소프트웨어를 사용하면분석 및 결과 해석이 용이함마케팅 조사나 광고 조사 분야에서 폭 넓게사용될 수

오늘 본 자료 더보기
  • 오늘 본 자료가 없습니다.
  • 저작권 관련 사항 정보 및 게시물 내용의 진실성에 대하여 레포트샵은 보증하지 아니하며, 해당 정보 및 게시물의 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 위 정보 및 게시물 내용의 불법적 이용, 무단 전재·배포는 금지됩니다. 저작권침해, 명예훼손 등 분쟁요소 발견시 고객센터에 신고해 주시기 바랍니다.
    사업자등록번호 220-06-55095 대표.신현웅 주소.서울시 서초구 방배로10길 18, 402호 대표전화.02-539-9392
    개인정보책임자.박정아 통신판매업신고번호 제2017-서울서초-1806호 이메일 help@reportshop.co.kr
    copyright (c) 2003 reoprtshop. steel All reserved.