빅 데이터
1. 최초의 정의 - 가트너(Gartner Inc)의 더그 레이니(Doug Laney)가 3가지 V로 정의
2. 데이터의 양(volume) + 데이터 입출력의 속도(velocity) + 데이터 종류의 다양성(variety)
빅데이터를 빠르게 분석하는 기술
1. 기계학습
2. 자연어 처리
3. 자동 분류
4. 데이터 마이닝
자동 분류의 구분
1. 문서 학습 과정 - 범주별로 학습 문서를 수집하여 지식 베이스를 구성
2. 문서 분류 과정 - 새로운 문서가 들어왔을 때 구성된 지식 베이스 정보를 활용하여 어떤 범주에 속하는지 할당
문서 학습 과정의 분류
1. 확률 기반 분류 - 생성되는 지식 베이스가 자질과 확률 값의 구조로 이루어짐.
2. 규칙 기반 분류 - 생성되는 지식 베이스가 범주를 구분할 수 있는 규칙으로 이루어짐.
규칙 기반 분류의 응용
1. 의료 진단용 전문가 시스템
2. 챗봇
3. 식품 선별기
단순화된 규칙 기반 분류
1. 규칙 찾기 게임(https://kimwooil.tistory.com/41)
2. 도형에서 규칙 찾기
다윗의 별 그리기1(외부 테두리와 정육각형)
다윗의 별 그리기2(정삼각형 6개)
십자모양 그리기1(외부 테두리와 정사각형)
십자모양 그리기2(정사각형 4개)