[42] 경인교육대학교 교육전문대학원 2023학년도 석사과정(AI교육 전공) 준비하기(5)

빅 데이터

1. 최초의 정의 - 가트너(Gartner Inc)의 더그 레이니(Doug Laney)가 3가지 V로 정의

2. 데이터의 양(volume) + 데이터 입출력의 속도(velocity) + 데이터 종류의 다양성(variety)

빅데이터를 빠르게 분석하는 기술

1. 기계학습

2. 자연어 처리

3. 자동 분류

4. 데이터 마이닝

자동 분류의 구분

1. 문서 학습 과정 - 범주별로 학습 문서를 수집하여 지식 베이스를 구성

2. 문서 분류 과정 - 새로운 문서가 들어왔을 때 구성된 지식 베이스 정보를 활용하여 어떤 범주에 속하는지 할당

문서 학습 과정의 분류

1. 확률 기반 분류 - 생성되는 지식 베이스가 자질과 확률 값의 구조로 이루어짐.

2. 규칙 기반 분류 - 생성되는 지식 베이스가 범주를 구분할 수 있는 규칙으로 이루어짐.

규칙 기반 분류의 응용

1. 의료 진단용 전문가 시스템

2. 챗봇

3. 식품 선별기

단순화된 규칙 기반 분류

2. 도형에서 규칙 찾기

다윗의 별 그리기1(외부 테두리와 정육각형)

다윗의 별 그리기2(정삼각형 6개)

십자모양 그리기1(외부 테두리와 정사각형)

십자모양 그리기2(정사각형 4개)

초등교사 김우일