데이터분석준전문가(ADsP)/3과목
-
목차 1. 분류분석과 예측분석 1-1 분류분석의 정의 데이터가 어떤 그룹에 속하는지 예측하는데 사용되는 기법이다. 클러스터링과 유사하지만, 분류분석은 각 그룹이 정의되어 있다. 교사학습(Supervised learning)에 해당하는 예측기법이다. 1-2 예측분석의 정의 - 시계열 분석처럼 시간에 따른 값 두 개만을 이용해 앞으로의 매출 또는 온도 등을 예측하는 것 - 모델링을 하는 입력 데이터가 어떤 것인지에 따라 특성이 다르다. - 여러 개의 다양한 설명변수(독립변수)가 아닌, 한 개의 설명변수로 생각하면 된다. 1-3 분류분석,예측분석의 공통점과 차이점 1) 공통점 레코드의 특정 속성의 값을 미리 알아맞히는 점이다. 2) 차이점 분류: 레코드(튜플)의 범주형 속성의 값을 알아맞히는 것이다. 예측: ..
[정형데이터 마이닝] 분류분석목차 1. 분류분석과 예측분석 1-1 분류분석의 정의 데이터가 어떤 그룹에 속하는지 예측하는데 사용되는 기법이다. 클러스터링과 유사하지만, 분류분석은 각 그룹이 정의되어 있다. 교사학습(Supervised learning)에 해당하는 예측기법이다. 1-2 예측분석의 정의 - 시계열 분석처럼 시간에 따른 값 두 개만을 이용해 앞으로의 매출 또는 온도 등을 예측하는 것 - 모델링을 하는 입력 데이터가 어떤 것인지에 따라 특성이 다르다. - 여러 개의 다양한 설명변수(독립변수)가 아닌, 한 개의 설명변수로 생각하면 된다. 1-3 분류분석,예측분석의 공통점과 차이점 1) 공통점 레코드의 특정 속성의 값을 미리 알아맞히는 점이다. 2) 차이점 분류: 레코드(튜플)의 범주형 속성의 값을 알아맞히는 것이다. 예측: ..
2021.08.27 -
목차 1. 연관규칙 1-1 연관규칙분석(Association Analysis)의 개념 본문 연관성 분석은 흔히 장바구니 분석(Market Basket Analysis)또는 서열분석(Sequence Analy-sis)이라고 불린다. 기업의 데이터베이스에서 상품의 구매, 서비스 등 인련의 거래 또는 사건들 간의 규칙을 발견하기 위해 적용한다. 장바구니 분석: '장바구니에 무엇이 같이 들어 있는지에 대한 분석' 서열분석: 'A를 산 다음에 B를 산다.' 1-2 연관규칙의 형태 조건과 반응의 형태(if-then)로 이루어져 있다. (Item set A) -> (Item set B) If A then B : 만일 A가 일어나면 B가 일어난다. 아메리카노를 마시는 손님 중 10%가 브라우니를 먹는다 샌드위치를 먹는..
[정형데이터 마이닝] 연관분석목차 1. 연관규칙 1-1 연관규칙분석(Association Analysis)의 개념 본문 연관성 분석은 흔히 장바구니 분석(Market Basket Analysis)또는 서열분석(Sequence Analy-sis)이라고 불린다. 기업의 데이터베이스에서 상품의 구매, 서비스 등 인련의 거래 또는 사건들 간의 규칙을 발견하기 위해 적용한다. 장바구니 분석: '장바구니에 무엇이 같이 들어 있는지에 대한 분석' 서열분석: 'A를 산 다음에 B를 산다.' 1-2 연관규칙의 형태 조건과 반응의 형태(if-then)로 이루어져 있다. (Item set A) -> (Item set B) If A then B : 만일 A가 일어나면 B가 일어난다. 아메리카노를 마시는 손님 중 10%가 브라우니를 먹는다 샌드위치를 먹는..
2021.08.26 -
목차 1. 군집분석 (clustering Analysis) 개요 관측된 여러 개의 변수로부터 유사성에 기초하여 n개의 군집으로 집단화하여 집단의 특성을 분석하는 다변량 분석 변수들이 속한 모집단 범주에 대한 사전정보가 없는 경우에 관측값들 사이의 거리(또는 유사성)를 이용하여 개체들을 자연스럽게 몇 개의 그룹 또는 군집(cluster)으로 나누는 분석법 각 객체(대상)의 유사성을 측정하여 유사성이 높은 대상 집단을 분류하고, 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체간의 상이성을 규명하는 분석방법이다. 특성에 따라 고객을 여러 개의 배타적인 집단으로 나누는 것이다. 결과는 구체적인 군집분석 방법에 따라 차이가 나타날 수 있다. 군집의 개수나 구조에 대한 가정 없이 데이터들 사이의 거리를 ..
[정형데이터 마이닝] 군집분석목차 1. 군집분석 (clustering Analysis) 개요 관측된 여러 개의 변수로부터 유사성에 기초하여 n개의 군집으로 집단화하여 집단의 특성을 분석하는 다변량 분석 변수들이 속한 모집단 범주에 대한 사전정보가 없는 경우에 관측값들 사이의 거리(또는 유사성)를 이용하여 개체들을 자연스럽게 몇 개의 그룹 또는 군집(cluster)으로 나누는 분석법 각 객체(대상)의 유사성을 측정하여 유사성이 높은 대상 집단을 분류하고, 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체간의 상이성을 규명하는 분석방법이다. 특성에 따라 고객을 여러 개의 배타적인 집단으로 나누는 것이다. 결과는 구체적인 군집분석 방법에 따라 차이가 나타날 수 있다. 군집의 개수나 구조에 대한 가정 없이 데이터들 사이의 거리를 ..
2021.08.25 -
목차 1. 데이터 마이닝의 정의 1. 대량의 데이터 집합으로부터 유용한 정보(Knowleage)를 추출하는 것 2. 의미있는 패턴과 규칙을 발견하기 위해서 자동화되거나 반자동화된 도구를 이용하여 대량의 데이터를 탐색하고 분석하는 과정 3. 통계 및 수학적 기술 뿐만 아니라 패턴 인식 기술들을 이용하여 데이터 저장소에 저장된 * 대용량의 데이터를 조사함으로써 의미있는 새로운 상관관계, 패턴, 추세 등을 발견하는 과정 *대용량데이터: 이 때 대용량 데이터를 저정한 장소는 데이터 웨어하우스이다. 데이터 베이스는 현재 운영하고 있는 시스템임 착각 노노 적용된 예시 사례 1. 구매 패턴의 발견 추천지수 A라는 책을 산 사람이 B라는 책을 샀고 이런 데이터를 모아서 사례분석기반이라는 방법, 연관성 분석 (Assoc..
[정형데이터 마이닝 ] 데이터 마이닝목차 1. 데이터 마이닝의 정의 1. 대량의 데이터 집합으로부터 유용한 정보(Knowleage)를 추출하는 것 2. 의미있는 패턴과 규칙을 발견하기 위해서 자동화되거나 반자동화된 도구를 이용하여 대량의 데이터를 탐색하고 분석하는 과정 3. 통계 및 수학적 기술 뿐만 아니라 패턴 인식 기술들을 이용하여 데이터 저장소에 저장된 * 대용량의 데이터를 조사함으로써 의미있는 새로운 상관관계, 패턴, 추세 등을 발견하는 과정 *대용량데이터: 이 때 대용량 데이터를 저정한 장소는 데이터 웨어하우스이다. 데이터 베이스는 현재 운영하고 있는 시스템임 착각 노노 적용된 예시 사례 1. 구매 패턴의 발견 추천지수 A라는 책을 산 사람이 B라는 책을 샀고 이런 데이터를 모아서 사례분석기반이라는 방법, 연관성 분석 (Assoc..
2021.08.21 -
목차 차원축소 목표를 위해 개발된 분석 방법 변수 간의 관계를 이해하는 것이 합리적으로 가능하지 않을 정도로 변수가 많은 경우 이것을 차원 축소를 한다. 이름에서 추측 가능하듯이 데이터 집합 내의 특징 수를 줄이기 위해 다양한 기법을 사용하는 것이다. 1. 주성분분석** 2. 요인분석(Factor Analysis) 3. 판별분석(Discriminant Analysis) 4. 군집분석(Cluster Analysis) 5. 정준상관분석(Canonical Correlation analysis) 6. 다차원척도법(Multi-dimensional scaling) 차원축소를 위해 개발된 6가지 중에 주성분 분석에 대해서 알아본다. 주성분 분석 (PCA, Pricipal Component Analysis) - 데이터..
[통계분석] 주성분분석목차 차원축소 목표를 위해 개발된 분석 방법 변수 간의 관계를 이해하는 것이 합리적으로 가능하지 않을 정도로 변수가 많은 경우 이것을 차원 축소를 한다. 이름에서 추측 가능하듯이 데이터 집합 내의 특징 수를 줄이기 위해 다양한 기법을 사용하는 것이다. 1. 주성분분석** 2. 요인분석(Factor Analysis) 3. 판별분석(Discriminant Analysis) 4. 군집분석(Cluster Analysis) 5. 정준상관분석(Canonical Correlation analysis) 6. 다차원척도법(Multi-dimensional scaling) 차원축소를 위해 개발된 6가지 중에 주성분 분석에 대해서 알아본다. 주성분 분석 (PCA, Pricipal Component Analysis) - 데이터..
2021.08.14 -
목차 01 다차원 척도법(Multidimensional Scaling) -객체간 근접성(Prximity)을 시각화하는 통계기법 MDS라고 줄여 부름. -군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/ 비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법 (쉽게 비슷한 개체들끼리 모아서 2차원 그래프로 표현해주는것) -개체들을 2차원 또는 3차원 공간상에 점으로 표현하는 개체들 사이의 집단화를 시각적으로 표현하는 분석 방법 -입력데이터는 케이스 간의 유사도(similarity)를 측정한 거리 데이터이며, 출력 결과는 케이스들이 기하학적 공간상에 배치된 그래프 - 기하학적 공간상에 배치된 케이스 간의 거리는 유사도의 크기를 나타냄(즉 유사한 케이스들은 서로 가까..
[통계분석] 다차원척도법목차 01 다차원 척도법(Multidimensional Scaling) -객체간 근접성(Prximity)을 시각화하는 통계기법 MDS라고 줄여 부름. -군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/ 비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법 (쉽게 비슷한 개체들끼리 모아서 2차원 그래프로 표현해주는것) -개체들을 2차원 또는 3차원 공간상에 점으로 표현하는 개체들 사이의 집단화를 시각적으로 표현하는 분석 방법 -입력데이터는 케이스 간의 유사도(similarity)를 측정한 거리 데이터이며, 출력 결과는 케이스들이 기하학적 공간상에 배치된 그래프 - 기하학적 공간상에 배치된 케이스 간의 거리는 유사도의 크기를 나타냄(즉 유사한 케이스들은 서로 가까..
2021.08.14