■ 머신러닝?
- 기존의 머신러닝 - OCR (광학 문자 판독기), 스팸 필터
- 기계가 배운다는 것의 의미
1.1 머신러닝이란?
■ 머신러닝
- 데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 과학
- 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다.
- 어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상됐다면, 이 컴퓨터 프로그램은 작업 T와 성능 측정 P에 대해 경험 E로 학습한 것이다.
• training set (훈련세트): 시스템이 학습하는 데 사용하는 샘플
• training instance (훈련사례, 샘플): 훈련세트의 각 훈련 데이터
• training data (훈련데이터): 훈련으로 인한 경험, 경험 E
• accuracy (정확도): 성능 측정 P
1.2 왜 머신러닝을 사용하는가?
■ 스팸필터의 예시
- 전통적인 방법
• 스팸에 해당하는 단어들, 메일 주소, 본문 내용 등등 다양한 요소들을 고려해야함.
• 문제에 대한 규칙이 점점 길고 복잡해지므로 유지보수하기 힘들어짐
- 머신러닝 기법
• 일반 메일에 비해 스팸 메일에 자주 나타나는 패턴을 감지하여 단어와 구절 등의 기준을 자동으로 학습하게 된다.
• 유지보수와 정확도의 측면에서 좋은 모습을 보임
• 변화하는 환경에 유동적으로 적응할 수 있다.
• 음성 인식과 같이 복잡한 문제의 해결에 좋은 솔루션
※ 데이터 마이닝
- 머신러닝 기술을 적용해서 대용량의 데이터를 분석함으로 겉으로는 보이지 않았던 패턴을 발견하고 학습할 수 있다.
1.3 머신러닝 시스템의 종류
■ 머신러닝 시스템의 종류 - 넓은 범주
- 사람의 감독 하에 훈련하는지: 지도, 비지도, 준지도, 강화학습
- 실시간으로 점진적인 학습을 하는지: 온라인 학습, 배치학습
- 알고있는 데이터 포인트와 새 데이터 포인트를 비교하는 것인지
훈련 데이터 셋에서 새로운 패턴을 발견하여 예측 모델을 만드는지: 사례기반 학습, 모델 기반 학습
1.3.1 지도 학습과 비지도 학습
■ 지도학습
- supervised learning
- 훈련 데이터에 label이 포함된다. (label: 해당 데이터를 입력했을때 나오길 기대하는 결과, 정답)
- 분류 (classification)
• 많은 데이터와 해당 데이터의 정보(label)로 훈련되어 분류하는 작업
- 회귀(regression)
• 예측 변수 (predictable variable), 특성 (feature)을 사용해 타깃 수치를 예측하는 작업
- 주요 알고리즘
• k-nearest neighbors
• linear regression
• logistic regression
• support vector machines
• decision tree, random forest
• neural networks
■ 비지도학습
- unsupervised learning
- 훈련 데이터에 label이 포함되어있지 않다.
- 알고리즘을 통해서 데이터 간의 연결고리를 스스로 찾아낸다.
- 주요 알고리즘
• 군집, clustering
> k-Means, Hierarchical Cluster Analysis, expectation maximization
• 시각화(visualization)와 차원축소 (dimensionality reduction)
> principal component analysis, kernel PCA, locally-linear embedding, t-distibuted stocastic neighbor embedding
• 연관규칙학습, ssociation tule learning
> apriori, eclat
■ 준지도학습
- semisupervised learning
- 일부 데이터만 label을 포함하고 있는 경우
- 대부분 지도 학습과 비지도 학습의 조합으로 이루어져 있다.
- 심층 신뢰 신경망, deep belief network (DBN): 여러 겹으로 쌓은 제한된 볼츠만 머신(RBM)이라는 비지도 학습에 기초함
■ 강화학습
- reinforcement learning
- agent: 학습하는시tmxpa
- reward, penalty: 환경을 관찰해서 행동을 실행하고 그 결과로 얻는 보상 또는 벌점
- policy: 가장 큰 보상을 얻기위한 최상의 전략
• 주어진 상황에서 에이전트가 어떤 행동을 선택해야 할지 정의한다.
'AI > 머신러닝' 카테고리의 다른 글
Ch3. 분류 (3.5~3.7) (0) | 2021.03.06 |
---|---|
Ch3. 분류 (3.1~3.4) (0) | 2021.03.04 |
Ch2. 머신러닝 프로젝트 처음부터 끝까지 (2.4 ~ 2.8) (0) | 2021.03.01 |
Ch2. 머신러닝 프로젝트 처음부터 끝까지 (2.1 ~ 2.3) (0) | 2021.02.28 |
Ch1. 한눈에 보는 머신러닝 (1.3.2~1.5) (0) | 2021.02.24 |