데이터분석준전문가(ADsP)
-
키워드 OLTP(갱신), OLAP(조회, CRM, SCM 제조부문: ERP, RTE, CRM, BI / 금융: EAI, EDW / 유통부문: RFID, KMS 물류부문: CVO, PORT-MIS, KROIS 지리/교통부문: GIS, RS, GPS, ITS, LBS, SIM 의료부문 : PACS, U헬스 교육부문 : NEIS 1. 기업내부 데이터베이스 정보통신만 구축이 가속화 되면서 1990년대의 기업내부 데이터베이스는 기업 경영 전반에 관한 인사, 조직, 생산, 영업 활동 등을 포함한 모든 자료를 연계하여 일관된 체계로 구축, 운영하는 경영 활동의 기반이 되는 전사 시스템으로 확대 되었다. 가. 1980년대 기업 내부 데이터베이스 OLTP(On-Line Transaction Processing) 호스트 ..
[데이터베이스의 이해] 데이터베이스의 활용키워드 OLTP(갱신), OLAP(조회, CRM, SCM 제조부문: ERP, RTE, CRM, BI / 금융: EAI, EDW / 유통부문: RFID, KMS 물류부문: CVO, PORT-MIS, KROIS 지리/교통부문: GIS, RS, GPS, ITS, LBS, SIM 의료부문 : PACS, U헬스 교육부문 : NEIS 1. 기업내부 데이터베이스 정보통신만 구축이 가속화 되면서 1990년대의 기업내부 데이터베이스는 기업 경영 전반에 관한 인사, 조직, 생산, 영업 활동 등을 포함한 모든 자료를 연계하여 일관된 체계로 구축, 운영하는 경영 활동의 기반이 되는 전사 시스템으로 확대 되었다. 가. 1980년대 기업 내부 데이터베이스 OLTP(On-Line Transaction Processing) 호스트 ..
2022.08.22 -
1. 용어의 연혁 1950년대 : 미국에서 군대의 군비상황을 집중 관리하기 위하여 컴퓨터 도서관을 설립하면서 데이터 기지라는 뜻의 데이터베이스가 탄생 1963년 6월 : 미국 'SDC'가 개최한 심포지엄에서 데이터베이스라는 용어 공식 사용 데이터베이스 초기 개념인 '대량의 데이터를 축적하는 기지' 1963:GE의 C. 바크만은 데이터베이스 관리 시스템인 IDS 개발 1965년: 2차 심포지엄에서 시스템을 통한 체계적 관리와 저장 등의 의미를 담은 '데이터베이스 시스템'이라는 용어 등장 1970년대 초반: 유럽에서 '데이터베이스'라는 단일어가 일반화 됨 1975년 : 미국의 CAC가 KORSTIC을 통해 서비스되면서 우리나라에서 데이터베이스 이용이 이루어짐 1980년 : KORSTIC이 해외 전문 데이터베..
[데이터의 이해] 데이터베이스 정의와 특징1. 용어의 연혁 1950년대 : 미국에서 군대의 군비상황을 집중 관리하기 위하여 컴퓨터 도서관을 설립하면서 데이터 기지라는 뜻의 데이터베이스가 탄생 1963년 6월 : 미국 'SDC'가 개최한 심포지엄에서 데이터베이스라는 용어 공식 사용 데이터베이스 초기 개념인 '대량의 데이터를 축적하는 기지' 1963:GE의 C. 바크만은 데이터베이스 관리 시스템인 IDS 개발 1965년: 2차 심포지엄에서 시스템을 통한 체계적 관리와 저장 등의 의미를 담은 '데이터베이스 시스템'이라는 용어 등장 1970년대 초반: 유럽에서 '데이터베이스'라는 단일어가 일반화 됨 1975년 : 미국의 CAC가 KORSTIC을 통해 서비스되면서 우리나라에서 데이터베이스 이용이 이루어짐 1980년 : KORSTIC이 해외 전문 데이터베..
2022.08.22 -
데이터 정의 데이터는 추론과 추정의 근거를 이루는 사실이다. 데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명되고 있다. 컴퓨터의 시작과 함께 자연과학 뿐만 아니라 경영학, 통계학 등에서 활용되고 있다. 과거 추상적인 개념에서 기술적이고 사실적인 의미로 변화되었다. 데이터의 특성 존재적 특성 : 객관적 사실(fact, raw material) 당위와 특성 : 추론, 예측, 전망, 추정을 위한 근거 (basis) 데이터의 유형 정성적 데이터 : 언어 ,문자 비정형/ 주관적 내용 / 통계분석이 어려움 정량적 데이터 : 수치, 도형, 기호 정형데이터 / 객관적 내용/ 통계분석이 용이함 암묵지 : 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 ..
[데이터의 이해] 데이터와 정보데이터 정의 데이터는 추론과 추정의 근거를 이루는 사실이다. 데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명되고 있다. 컴퓨터의 시작과 함께 자연과학 뿐만 아니라 경영학, 통계학 등에서 활용되고 있다. 과거 추상적인 개념에서 기술적이고 사실적인 의미로 변화되었다. 데이터의 특성 존재적 특성 : 객관적 사실(fact, raw material) 당위와 특성 : 추론, 예측, 전망, 추정을 위한 근거 (basis) 데이터의 유형 정성적 데이터 : 언어 ,문자 비정형/ 주관적 내용 / 통계분석이 어려움 정량적 데이터 : 수치, 도형, 기호 정형데이터 / 객관적 내용/ 통계분석이 용이함 암묵지 : 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 ..
2022.08.22 -
목차 1. 분류분석과 예측분석 1-1 분류분석의 정의 데이터가 어떤 그룹에 속하는지 예측하는데 사용되는 기법이다. 클러스터링과 유사하지만, 분류분석은 각 그룹이 정의되어 있다. 교사학습(Supervised learning)에 해당하는 예측기법이다. 1-2 예측분석의 정의 - 시계열 분석처럼 시간에 따른 값 두 개만을 이용해 앞으로의 매출 또는 온도 등을 예측하는 것 - 모델링을 하는 입력 데이터가 어떤 것인지에 따라 특성이 다르다. - 여러 개의 다양한 설명변수(독립변수)가 아닌, 한 개의 설명변수로 생각하면 된다. 1-3 분류분석,예측분석의 공통점과 차이점 1) 공통점 레코드의 특정 속성의 값을 미리 알아맞히는 점이다. 2) 차이점 분류: 레코드(튜플)의 범주형 속성의 값을 알아맞히는 것이다. 예측: ..
[정형데이터 마이닝] 분류분석목차 1. 분류분석과 예측분석 1-1 분류분석의 정의 데이터가 어떤 그룹에 속하는지 예측하는데 사용되는 기법이다. 클러스터링과 유사하지만, 분류분석은 각 그룹이 정의되어 있다. 교사학습(Supervised learning)에 해당하는 예측기법이다. 1-2 예측분석의 정의 - 시계열 분석처럼 시간에 따른 값 두 개만을 이용해 앞으로의 매출 또는 온도 등을 예측하는 것 - 모델링을 하는 입력 데이터가 어떤 것인지에 따라 특성이 다르다. - 여러 개의 다양한 설명변수(독립변수)가 아닌, 한 개의 설명변수로 생각하면 된다. 1-3 분류분석,예측분석의 공통점과 차이점 1) 공통점 레코드의 특정 속성의 값을 미리 알아맞히는 점이다. 2) 차이점 분류: 레코드(튜플)의 범주형 속성의 값을 알아맞히는 것이다. 예측: ..
2021.08.27 -
목차 1. 연관규칙 1-1 연관규칙분석(Association Analysis)의 개념 본문 연관성 분석은 흔히 장바구니 분석(Market Basket Analysis)또는 서열분석(Sequence Analy-sis)이라고 불린다. 기업의 데이터베이스에서 상품의 구매, 서비스 등 인련의 거래 또는 사건들 간의 규칙을 발견하기 위해 적용한다. 장바구니 분석: '장바구니에 무엇이 같이 들어 있는지에 대한 분석' 서열분석: 'A를 산 다음에 B를 산다.' 1-2 연관규칙의 형태 조건과 반응의 형태(if-then)로 이루어져 있다. (Item set A) -> (Item set B) If A then B : 만일 A가 일어나면 B가 일어난다. 아메리카노를 마시는 손님 중 10%가 브라우니를 먹는다 샌드위치를 먹는..
[정형데이터 마이닝] 연관분석목차 1. 연관규칙 1-1 연관규칙분석(Association Analysis)의 개념 본문 연관성 분석은 흔히 장바구니 분석(Market Basket Analysis)또는 서열분석(Sequence Analy-sis)이라고 불린다. 기업의 데이터베이스에서 상품의 구매, 서비스 등 인련의 거래 또는 사건들 간의 규칙을 발견하기 위해 적용한다. 장바구니 분석: '장바구니에 무엇이 같이 들어 있는지에 대한 분석' 서열분석: 'A를 산 다음에 B를 산다.' 1-2 연관규칙의 형태 조건과 반응의 형태(if-then)로 이루어져 있다. (Item set A) -> (Item set B) If A then B : 만일 A가 일어나면 B가 일어난다. 아메리카노를 마시는 손님 중 10%가 브라우니를 먹는다 샌드위치를 먹는..
2021.08.26 -
목차 1. 군집분석 (clustering Analysis) 개요 관측된 여러 개의 변수로부터 유사성에 기초하여 n개의 군집으로 집단화하여 집단의 특성을 분석하는 다변량 분석 변수들이 속한 모집단 범주에 대한 사전정보가 없는 경우에 관측값들 사이의 거리(또는 유사성)를 이용하여 개체들을 자연스럽게 몇 개의 그룹 또는 군집(cluster)으로 나누는 분석법 각 객체(대상)의 유사성을 측정하여 유사성이 높은 대상 집단을 분류하고, 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체간의 상이성을 규명하는 분석방법이다. 특성에 따라 고객을 여러 개의 배타적인 집단으로 나누는 것이다. 결과는 구체적인 군집분석 방법에 따라 차이가 나타날 수 있다. 군집의 개수나 구조에 대한 가정 없이 데이터들 사이의 거리를 ..
[정형데이터 마이닝] 군집분석목차 1. 군집분석 (clustering Analysis) 개요 관측된 여러 개의 변수로부터 유사성에 기초하여 n개의 군집으로 집단화하여 집단의 특성을 분석하는 다변량 분석 변수들이 속한 모집단 범주에 대한 사전정보가 없는 경우에 관측값들 사이의 거리(또는 유사성)를 이용하여 개체들을 자연스럽게 몇 개의 그룹 또는 군집(cluster)으로 나누는 분석법 각 객체(대상)의 유사성을 측정하여 유사성이 높은 대상 집단을 분류하고, 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체간의 상이성을 규명하는 분석방법이다. 특성에 따라 고객을 여러 개의 배타적인 집단으로 나누는 것이다. 결과는 구체적인 군집분석 방법에 따라 차이가 나타날 수 있다. 군집의 개수나 구조에 대한 가정 없이 데이터들 사이의 거리를 ..
2021.08.25