본문 바로가기

AI/머신러닝

Ch1. 한눈에 보는 머신러닝 (1.1 ~ 1.3.1)

반응형

■ 머신러닝?

  - 기존의 머신러닝 - OCR (광학 문자 판독기), 스팸 필터

  - 기계가 배운다는 것의 의미

 

1.1 머신러닝이란?

  ■ 머신러닝

    - 데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 과학

    - 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다.

    - 어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상됐다면, 이 컴퓨터 프로그램은 작업 T와 성능 측정 P에 대해 경험 E로 학습한 것이다.

      • training set (훈련세트): 시스템이 학습하는 데 사용하는 샘플

      • training instance (훈련사례, 샘플): 훈련세트의 각 훈련 데이터

      • training data (훈련데이터): 훈련으로 인한 경험, 경험 E

      • accuracy (정확도): 성능 측정 P

 

1.2 왜 머신러닝을 사용하는가?

  ■ 스팸필터의 예시

    - 전통적인 방법

      • 스팸에 해당하는 단어들, 메일 주소, 본문 내용 등등 다양한 요소들을 고려해야함. 

      • 문제에 대한 규칙이 점점 길고 복잡해지므로 유지보수하기 힘들어짐

    - 머신러닝 기법

      • 일반 메일에 비해 스팸 메일에 자주 나타나는 패턴을 감지하여 단어와 구절 등의 기준을 자동으로 학습하게 된다.

      • 유지보수와 정확도의 측면에서 좋은 모습을 보임

      • 변화하는 환경에 유동적으로 적응할 수 있다.

      • 음성 인식과 같이 복잡한 문제의 해결에 좋은 솔루션

 

  ※ 데이터 마이닝

    - 머신러닝 기술을 적용해서 대용량의 데이터를 분석함으로 겉으로는 보이지 않았던 패턴을 발견하고 학습할 수 있다.

 

1.3 머신러닝 시스템의 종류

  ■ 머신러닝 시스템의 종류 - 넓은 범주

    - 사람의 감독 하에 훈련하는지: 지도, 비지도, 준지도, 강화학습

    - 실시간으로 점진적인 학습을 하는지: 온라인 학습, 배치학습

    - 알고있는 데이터 포인트와 새 데이터 포인트를 비교하는 것인지

       훈련 데이터 셋에서 새로운 패턴을 발견하여 예측 모델을 만드는지: 사례기반 학습, 모델 기반 학습

 

1.3.1 지도 학습과 비지도 학습

  ■ 지도학습

    - supervised learning

    - 훈련 데이터에 label이 포함된다. (label: 해당 데이터를 입력했을때 나오길 기대하는 결과, 정답)

    - 분류 (classification)

      • 많은 데이터와 해당 데이터의 정보(label)로 훈련되어 분류하는 작업

    - 회귀(regression)

      • 예측 변수 (predictable variable), 특성 (feature)을 사용해 타깃 수치를 예측하는 작업

    - 주요 알고리즘

      • k-nearest neighbors

      • linear regression

      • logistic regression

      • support vector machines

      • decision tree, random forest

      • neural networks

 

  ■ 비지도학습

    - unsupervised learning

    - 훈련 데이터에 label이 포함되어있지 않다.

    - 알고리즘을 통해서 데이터 간의 연결고리를 스스로 찾아낸다.

    - 주요 알고리즘

      • 군집, clustering

         > k-Means, Hierarchical Cluster Analysis, expectation maximization

      • 시각화(visualization)와 차원축소 (dimensionality reduction)

         > principal component analysis, kernel PCA, locally-linear embedding, t-distibuted stocastic neighbor embedding

      • 연관규칙학습, ssociation tule learning

         > apriori, eclat

 

  ■ 준지도학습

    - semisupervised learning

    - 일부 데이터만 label을 포함하고 있는 경우

    - 대부분 지도 학습과 비지도 학습의 조합으로 이루어져 있다.

    - 심층 신뢰 신경망, deep belief network (DBN): 여러 겹으로 쌓은 제한된 볼츠만 머신(RBM)이라는 비지도 학습에 기초함

 

  ■ 강화학습

    - reinforcement learning

    - agent: 학습하는시tmxpa

    - reward, penalty: 환경을 관찰해서 행동을 실행하고 그 결과로 얻는 보상 또는 벌점

    - policy: 가장 큰 보상을 얻기위한 최상의 전략

      • 주어진 상황에서 에이전트가 어떤 행동을 선택해야 할지 정의한다.

반응형