본문 바로가기

5. AI교육

[44] 경인교육대학교 교육전문대학원 2023학년도 석사과정(AI교육 전공) 준비하기(7) - 인공지능 교육개론 챕터5(기계학습 이해하기)

 

챕터5 기계학습 이해하기

기계학습의 정의

1. 데이터를 이용해 기계를 훈련시켜서, 기계 스스로 결정을 내리거나 예측할 수 있도록 하는 인공지능의 방법

2. 4가지 범주 - 지도형 기계학습, 비지도형 기계학습, 준지도형 기계학습, 강화형 기계학습

 

지도형 기계학습

1. 알고리즘의 결과와 정답 데이터를 비교하며 반복적으로 훈련해 나가는 방법

2. 해결 가능한 문제 - 분류(Classification), 회귀(Regression)

3. 신경망(Neural Network) 모델도 지도형 기계학습 중 하나

4. 신경망 모델 - 모델의 출력값으로부터 거꾸로 내려가면서 신경망 연결에 대한 가중치 조정(경사하강법 등)을 반복하여 훈련

 

비지도형 기계학습

1. 정답 레이블 없이 입력 데이터들이 가진 공통점에 따라 스스로 기준을 세워 분류한다.

2. 클러스터링(Clustering) - 데이터의 중심(Centroid)점 값을 이용해 중심점 주변의 데이터들을 그룹화시킨다.

3. 연관성(Association) - 대량의 데이터로 각각의 패턴을 나타내어, 데이터 세트 사이의 연관성을 보여준다.

4. 이상 탐지(Anomaly Detection) - 데이터 셋에 속한 다량의 정상적인 예제와 소량의 비정상적인 예제를 통해 비정상적인 데이터를 찾는 방법

 

준지도형 기계학습

1. 지도형 기계학습과 비지도형 기계학습을 결합한 형태

2. 레이블이 지정된 데이터와 지정되지 않은 데이터가 모두 포함된 경우 주로 사용

 

강화형 기계학습

1. 에이전트(Agent)에게 행동의 결과를 바탕으로 +나 - 또는 0의 보상을 돌려받을 수 있다.

2. 누적 보상을 극대화할 수 있는 행동 모델을 형성한다.

3. 최종 목표는 환경(Environment)과 상호작용을 하는 임의의 에이전트를 학습시키는 것이다.

 

Weka(Waikato Environment for Knowledge Analysis)

1. Waikato 대학교에서 개발한 기계학습 프로그램

2. 데이터 전처리, 특징 값 선별, 군집화, 분류, 데이터 가시화, 회귀분석, 시계열 예측에 사용된다.

3. 고가의 상용 도구에 뒤지지 않는 기능을 가진 오픈 소스 소프트웨어로 많은 분야에서 사용된다.

 

Weka의 장점

1. 다양한 기계학습 알고리즘 제공하여 여러 가지 분석 결과를 비교할 수 있다.

2. 사용 과정이 어렵지 않다.

3. 오픈소스임에도 다른 프로그램에 비해 뒤쳐지지 않는 성능을 가졌다.

 

Weka의 단점

1. 이미지 데이터를 활용할 수 없다.

2. 결과 값 분석이 쉽지 않다.

 

기계학습 과정

1. 속성 정의 - 다른 사물들과 구별될 수 있는 명확한 특징을 갖춘 속성을 정의

2. 샘플 집 및 데이터 셋 구성 - 오류나 불필요한 속성이 포함되지 않도록 자료를 구성

3. 패턴분류 수행 - 다양한 기계학습 알고리즘(결정 트리, 인공 신경망, SVM, 회귀분석 등)을 사용하여 패턴 분류 수행

4. 패턴 분류 성능 평가 - 도출된 패턴 분류를 분석(상대적 비교)하여 성능을 평가

 

의사결정 트리

1. 기계학습 알고리즘에서 많이 사용되는 것 중 하나

2. Hartigan(1975)이 제안한 Chaid

3. Breiman 등 (1984)이 제안한 Cart

4. Quinlan(1992)이 제안한 C4.5

5. Weka는 C4.5를 확장하여 구현한 J84를 활용한다.