지도학습 Supervised Learning / 비지도학습 Unsupervised Learning / 강화학습 Reinforcement Learning

DS | Data Science/ML | Machine Learning

지도학습 Supervised Learning / 비지도학습 Unsupervised Learning / 강화학습 Reinforcement Learning

_껀이_ 2022. 7. 15. 22:03

728x90

머신러닝의 목표는 주로 예측이며, 다양한 예측을 가능하게 하기 위해 데이터를 활용하여 학습시키는 방법이라고 할수 있습니다.

데이터를 어떻게 학습시키는지 또, 사람의 개입이 이루어지는지에 따라 아래 세 가지로 나누어집니다.

1. Supervised Learning : 지도학습

2. Unsupervised Learning : 비지도학습

3. Reinforcement Learning : 강화학습

크게 나누면 지도/비지도학습 두 종류이지만 그 둘에 속하지 않는 특이한 학습방법으로 강화학습까지 포함하여 세 가지 방법론에 대해서 정리해보도록 하겠습니다.

1. Supervised Learning : 지도학습

지도학습은 정답(label)이 있는 데이터를 사용하여 학습하는 방법입니다.

label이 있기 때문에 실제값과 예측값의 차이를 비교함으로써 모델의 평가가 가능하며 최적의 모델을 지향할 수 있습니다.

1-1. Classification : 분류

분류는 예측하는 결과값이 이산값(dicrete value)로 이루어질 경우에 사용합니다. 그렇지만 T/F로 나누어지는 값 뿐만 아니라 이미지, 텍스트, 음성 등의 비정형 데이터로 이루어진 경우에도 활용할 수 있습니다. 또, 1,0만으로 분류하는 Binary classification, 비정형/정형 데이터를 복합적으로 사용할 수도 있는 Decision Tree, 어떤 사건이 발생할지를 직접 예측하는 것이 아니라 해당 사건이 발생할 확률을 예측하는 Logistic Regression 등이 있습니다.

일반적인 분류의 유명한 예시인 개vs고양이 분류 문제를 보면

위 이미지를 보면 개 사진에는 'dog'라는 label이 붙어있고 고양이 사진에는 'cat'이라는 label이 붙어있습니다. 모델에 Input 값으로 이미지와 label을 넣게 되면, 모델은 이미지의 feature를 label과 함께 학습하게 됩니다. 학습이 완료된 후에 모델에 개 이미지를 넣게되면 'dog'라는 답을 낼 수 있도록 되는 것입니다.

* 위의 경우는 개와 고양이 두 가지 경우만 있으므로 Binary classifiction 문제로 보고 풀 수도 있습니다.

이때 모델은 이미지에서 추출한 features를 학습하게 되고, 이를 통해서 이미지를 분류하기 때문에 feature 값이 유사한 다른 이미지를 넣었을때도 똑같이 'dog'라는 결과를 도출할 수 있다는 문제가 있습니다. 이는 후에 컴퓨터비전 카테고리에서 자세히 다룰 예정입니다.

1-2. Regression : 회귀

회귀는 결과값이 수치로 이루어진 연속값(continuous value)일 경우에 사용합니다. 주로 정형데이터를 사용하며 연속적인 수치이기 때문에 그래프 등을 통해 선형/비선형적 관계를 찾아 값을 예측할 때 사용합니다.

위의 그림은 산포되어있는 데이터(점) 간의 관계를 찾아내서 그 값들을 generous하게 대표하는 선(붉은색)을 찾아낸 예시입니다.

- 지도학습은 label이 있는 데이터를 사용하는 학습방법

- 종류 : 분류 / 회귀

- label이 있기 때문에 모델의 성능평가가 가능함 : 실제 label값과 예측값의 차이를 비교함

2. Unsupervised Learning : 비지도학습

비지도학습은 label이 없는 데이터를 사용하여 학습하는 방법입니다.

label이 없기 때문에 최적의 모델이라는 개념이 모호하며 성능적으로도 평가가 불가합니다. label과 성능지표가 없지만 그럼에도 불구하고 나름의 지표는 있으며, 그걸 통해서 모델을 tuning합니다. 비지도학습은 지도학습과는 달리 평가(지표 등)에 목적을 두는 것이 아니라, 모델들의 최적화한 결과에 대해 해석하고 활용하는 것에 목적을 둡니다.

2-1. Clustering : 군집

군집은 주어진 데이터를 유사한 속성을 중심으로 그룹핑하는 것을 말합니다.

입력변수간의 관계를 탐색적으로 분석함으로써 의미있는 정보를 추출하고, 그 정보를 통해서 데이터끼리 그룹핑하게 됩니다.

군집의 방법으로는

1) Non-overlapping Clustering : 분할 군집

2) Hierarchical Clustering : 계층 군집

3) K-Means Clustering

4) Mean Shift

등이 있습니다.

군집 외에도 비지도학습에는 밀도 추청(Density Estimation), 이상치 탐지(Anomaly Detection) 등이 있습니다.

3. Reinforcement Learning : 강화학습

앞서 언급한 지도학습과 비지도학습은 정적인 데이터, 즉 데이터가 이미 주어진 환경에서 학습이 진행되는 것이고 데이터 처리에 대해 사람의 개입이 어느정도 발생하게 됩니다.

강화학습은 사람의 개입 대신 에이전트가 주어진 환경에 대한 처리를 하고 그에 따라 발생하는 데이터들을 다시 환경에 추가함으로써 반복학습을 하게되는 방법을 말합니다.

에이전트는 처음 주어진 데이터 환경에 대해 어떠한 action을 취하게 되고 그에 따른 reward를 받게 됩니다. action에 대해 변화한 state를 기준으로 다시 에이전트는 action을 취하고 reward를 받습니다. 에이전트는 reward를 더 많이 받는 방향으로 action을 취하게 되고 이러한 싸이클을 반복함으로써 모델이 학습하는 것을 강화학습이라고 합니다.

728x90

저작자표시 비영리 변경금지 (새창열림)

'DS | Data Science > ML | Machine Learning' 카테고리의 다른 글

[RNN] Recurrent Neural Network : 순환신경망 (2)	2022.09.23
[CNN] Convolutional Neural Network : 합성곱 신경망 (1)	2022.09.23
[Back propagation] 역전파 (0)	2022.09.21
[Gradient Descent & Gradient ascent] 경사상승법 & 경사하강법 (1)	2022.09.21
Neural Network basic - NN, Gradient Descent, Error Back Propagation은 무엇일까? (0)	2022.07.15

현재글지도학습 Supervised Learning / 비지도학습 Unsupervised Learning / 강화학습 Reinforcement Learning

ML Engineer

250x250

딥러닝, recommender system, 코딩테스트, recommendation system, 네이버커넥트, linear algebra, 앱만들기, Flutter, 선대, ML, 프로그래머스, 추천시스템, 부스트캠프, recsys, 4기, 선형대수, 프로그래머스 고득점 kit, 선형대수학, AI_Tech, 수학,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

日日 Deep 每日 Learning