Ch1. 한눈에 보는 머신러닝 (1.1 ~ 1.3.1)

■ 머신러닝?

- 기존의 머신러닝 - OCR (광학 문자 판독기), 스팸 필터

- 기계가 배운다는 것의 의미

1.1 머신러닝이란?

■ 머신러닝

- 데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 과학

- 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다.

- 어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상됐다면, 이 컴퓨터 프로그램은 작업 T와 성능 측정 P에 대해 경험 E로 학습한 것이다.

• training set (훈련세트): 시스템이 학습하는 데 사용하는 샘플

• training instance (훈련사례, 샘플): 훈련세트의 각 훈련 데이터

• training data (훈련데이터): 훈련으로 인한 경험, 경험 E

• accuracy (정확도): 성능 측정 P

1.2 왜 머신러닝을 사용하는가?

■ 스팸필터의 예시

- 전통적인 방법

• 스팸에 해당하는 단어들, 메일 주소, 본문 내용 등등 다양한 요소들을 고려해야함.

• 문제에 대한 규칙이 점점 길고 복잡해지므로 유지보수하기 힘들어짐

- 머신러닝 기법

• 일반 메일에 비해 스팸 메일에 자주 나타나는 패턴을 감지하여 단어와 구절 등의 기준을 자동으로 학습하게 된다.

• 유지보수와 정확도의 측면에서 좋은 모습을 보임

• 변화하는 환경에 유동적으로 적응할 수 있다.

• 음성 인식과 같이 복잡한 문제의 해결에 좋은 솔루션

※ 데이터 마이닝

- 머신러닝 기술을 적용해서 대용량의 데이터를 분석함으로 겉으로는 보이지 않았던 패턴을 발견하고 학습할 수 있다.

1.3 머신러닝 시스템의 종류

■ 머신러닝 시스템의 종류 - 넓은 범주

- 사람의 감독 하에 훈련하는지: 지도, 비지도, 준지도, 강화학습

- 실시간으로 점진적인 학습을 하는지: 온라인 학습, 배치학습

- 알고있는 데이터 포인트와 새 데이터 포인트를 비교하는 것인지

훈련 데이터 셋에서 새로운 패턴을 발견하여 예측 모델을 만드는지: 사례기반 학습, 모델 기반 학습

1.3.1 지도 학습과 비지도 학습

■ 지도학습

- supervised learning

- 훈련 데이터에 label이 포함된다. (label: 해당 데이터를 입력했을때 나오길 기대하는 결과, 정답)

- 분류 (classification)

• 많은 데이터와 해당 데이터의 정보(label)로 훈련되어 분류하는 작업

- 회귀(regression)

• 예측 변수 (predictable variable), 특성 (feature)을 사용해 타깃 수치를 예측하는 작업

- 주요 알고리즘

• k-nearest neighbors

• linear regression

• logistic regression

• support vector machines

• decision tree, random forest

• neural networks

■ 비지도학습

- unsupervised learning

- 훈련 데이터에 label이 포함되어있지 않다.

- 알고리즘을 통해서 데이터 간의 연결고리를 스스로 찾아낸다.

- 주요 알고리즘

• 군집, clustering

> k-Means, Hierarchical Cluster Analysis, expectation maximization

• 시각화(visualization)와 차원축소 (dimensionality reduction)

> principal component analysis, kernel PCA, locally-linear embedding, t-distibuted stocastic neighbor embedding

• 연관규칙학습, ssociation tule learning

> apriori, eclat

■ 준지도학습

- semisupervised learning

- 일부 데이터만 label을 포함하고 있는 경우

- 대부분 지도 학습과 비지도 학습의 조합으로 이루어져 있다.

- 심층 신뢰 신경망, deep belief network (DBN): 여러 겹으로 쌓은 제한된 볼츠만 머신(RBM)이라는 비지도 학습에 기초함

■ 강화학습

- reinforcement learning

- agent: 학습하는시tmxpa

- reward, penalty: 환경을 관찰해서 행동을 실행하고 그 결과로 얻는 보상 또는 벌점

- policy: 가장 큰 보상을 얻기위한 최상의 전략

• 주어진 상황에서 에이전트가 어떤 행동을 선택해야 할지 정의한다.

'AI > 머신러닝' 카테고리의 다른 글

Ch3. 분류 (3.5~3.7) (0)	2021.03.06
Ch3. 분류 (3.1~3.4) (0)	2021.03.04
Ch2. 머신러닝 프로젝트 처음부터 끝까지 (2.4 ~ 2.8) (0)	2021.03.01
Ch2. 머신러닝 프로젝트 처음부터 끝까지 (2.1 ~ 2.3) (0)	2021.02.28
Ch1. 한눈에 보는 머신러닝 (1.3.2~1.5) (0)	2021.02.24

모르는 게 너무 많다.

Ch1. 한눈에 보는 머신러닝 (1.1 ~ 1.3.1)

'AI > 머신러닝' 카테고리의 다른 글

티스토리툴바

Ch1. 한눈에 보는 머신러닝 (1.1 ~ 1.3.1)

'AI > 머신러닝' 카테고리의 다른 글

'AI/머신러닝' Related Articles

티스토리툴바