분류 전체보기 (247) 썸네일형 리스트형 Ch3. 분류 (3.5~3.7) 3.5 에러 분석 - 에러의 종류를 분석하여 모델의 성능을 향상시킨다. ■ 오차 행렬 분석 - 오차행렬의 각 값을 클래스 별 이미지 개수로 나누어 에러 비율 비교 - 각 클래스 간의 에러 비율 (a를 b로 분류하는 경우 등)을 이미지로 분석 - confusion_matrix() 함수를 호출 - plt.matxhow() 함수 사용하여 이미지로 표현 3.6 다중 레이블 분류 ■ 다중 레이블 분류, multilabel classfication - 분류기의 샘플마다 여러 개의 클래스를 출력해야하는 경우 - 여러개의 이진 레이블을 출력하는 분류 시스템 - sklearn.neighbors.NeightborsClassifier: knn classifier 3.7 다중 출력 분류 ■ 다중 출력 다중 클래스 분류. mu.. ch05. 파이썬 날개달기 (내장함수, 라이브러리) 5. 내장함수 - abs(x): x의 절대값을 반환한다. - all(x): iterable한 변수 x를 인수로 받아서, x의 모든 요소가 True인지 여부를 반환해준다. - any(x): iterable한 변수 x의 요소 중 하나라도 True가 있는 경우 True를 반환해준다. - chr(x): ASCII 값 x를 입력받아서 해당하는 문자를 출력한다. - ord(x): 입력받은 문자 x의 ASCII 코드를 반환해준다. - dir(x): 객체 x가 가지고 있는 변수나 함수를 보여준다. list나 dict 객체의 변수, 함수 등을 보여준다. - divmod(a, b): a를 b로 나눈 몫과 나머지를 튜플 형태로 반환한다. - enumerate(x): 순서가 있는 자료형(리스트, 튜플, 문자열)을 입력으로 받.. Ch3. 분류 (3.1~3.4) 3.1 MNIST ■ MNIST - 숫자를 손으로 적은 이미지 데이터 셋 - 해당 이미지를 학습해서 각 이미지가 어떤 숫자를 적은 이미지인지 분류한다. 3.2 이진 분류기 훈련 ■ 이진 분류기, classifier - True or False 분류 ■ 확률적 경사 하강법, Stochastic Gradient Descent (SGD) - scikit-learn SGDClassifier - 매우 큰 데이터셋을 효율적으로 처라 - SGD가 한번에 하나씩 훈련 샘플을 독립적으로 처리 -> 온라인 학습에 잘 들어맞는다. 3.3 성능 측정 3.3.1 교차 검증을 사용한 정확도 측정 - 교차검증의 경우 불균형한 데이터 셋을 다루는 등의 경우에 분류기의 성능 측정 지표로 적합하지 않다. 3.3.2 오차 행렬 ■ 오차 .. ch05. 파이썬 날개달기 (패키지, 예외처리) 3. 패키지 ■ 패키지 - 파이썬 패키지는 디렉토리와 파이썬 모듈로 이루어진 구조이다. - .(dot)을 이용해서 계층적으로 접근 관리가 가능하다. ■ __init__.py - 해당 디렉토리가 패키지의 일부임을 알려주는 역할을 한다. ※ python3.3 버전부터는 __init__.py 파일이 없어도 패키지로 인식한다(PEP 420). 하지만 하위 버전 호환을 위해 __init__.py 파일을 생성하는 것이 안전한 방법이다. - __all__ 변수 • 패키지 import 시에 *를 사용해 import 할 모듈들을 정의하는 변수 • __all__ 변수에 정의되어 있지 않은 모듈은 *를 통해서 해당 패키지를 import 해도 사용할 수 없다. ※ from a.b.c import * 에서 패키지의 마지막인 c.. Ch2. 머신러닝 프로젝트 처음부터 끝까지 (2.4 ~ 2.8) 2.4 데이터 이해를 위한 탐색과 시각화 2.4.1 지리적 데이터 시각화 ■ 지리정보 (경도와 위도)를 통해 데이터 시각화 - pandas.DataFrame.plot(kind, x, y) • kind: plot의 종류 ('line', 'bar', 'scatter' ...) • x: x축 • y: y축 - 캘리포니아의 주택가격이 지역(바다와 인접), 인구 밀도에 관련이 크다는 것을 확인할 수 있다. 2.4.2 상관관계 조사 ■ 표준 상관계수, standard correlation coefficient - 피어슨의 r - pandas.DataFrame.corr(): 각 컬럼간의 상관계수를 계산해준다. - 상관관계의 범위: -1 ~ 1 • 1에 가까울수록 양의 상관관계를 가진다. (비례관계) • -1에 가까울.. Ch2. 머신러닝 프로젝트 처음부터 끝까지 (2.1 ~ 2.3) 2.1 실제 데이터로 작업하기 - 예제 깃허브에 있는 dataset/housing 데이터 사용 - https://github.com/rickiepark/handson-ml 2.2 큰 그림 보기 - 캘리포니아 인구조사 데이터를 사용해 캘리포니아 주택 가격 모델 생성 • 인구, 중간 소득, 중간 주택 가격 등의 데이터 2.2.1 문제 정의 ■ 비즈니스의 목적이 무엇인가? - 모델을 생성해서 어떤 이익을 얻으려고 하는가? - 알고리즘 선택, 모델 평가에 사용할 성능 지표, 모델 튜닝 ※ 파이프라인 - 데이터 처리 컴포넌트들이 연속되어 있는 것 - 각 컴포넌트는 많은 데이터를 추출해 처리하고 그 결과를 다른 데이터 저장소로 보낸다. ■ 현재 솔루션은 어떻게 구성되어 있는가? - 문제 해결 방법에 대한 정보 & .. ch05. 파이썬 날개달기 (모듈) 2. 모듈 ■ 모듈 - 모듈이란 변수 또는 클래스를 모아놓은 파일이다. - 모듈은 다른 파이썬 프로그램에서 불러와 사용할 수 있게끔 만든 파이썬 파일이다. ■ 모듈 만들기 - 모듈 생성 # mod1.py def add(a, b): return a + b def sub(a, b): return a-b - mod1이라는 모듈에 add와 sub라는 함수를 생성했다. ※ .py 확장자를 가지는 파이썬 파일들은 모두 파이썬 모듈이다. ■ 모듈 불러오기 - 모듈을 불러올 때는 해당 모듈이 위치하는 곳에서 import를 사용해서 불러올 수 있다. # mod1 모듈 사용예제 # import {모듈이름} import mod1 print(mod1.add(3, 4))# 7 print(mod1.sub(4, 2))# 2 - i.. [Slack Bot 만들기] 3. crontab 등록하여 자동실행하기 앞서 2번에서 만든 소스를 crontab에 등록하여서 정해진 시간에 자동으로 실행되도록 합니다. cron은 Linux 기반의 운영체제에서 특정 시간에 특정 작업을 진행할 수 있도록 해주는 프로그램입니다. 기본적으로 crontab 명령어는 -e, -l, -r 3가지 옵션을 통해서 사용합니다. # 크론탭을 편집하는 명령어입니다. 크론탭이 존재하지 않는다면 비어있는 파일을 만들어서 새로운 크론탭으로 등록합니다. crontab -e # 크론탭의 내용을 출력하는 명령어입니다. crontab -l # 크론탭을 삭제할 때 사용하는 명령어입니다. crontab -r 크론탭 내부에서는 수행하고자 하는 명령어와 해당 프로그램을 수행시킬 시간을 등록하게 됩니다. 문법은 다음과 같습니다. * * * * * /location/.. 이전 1 ··· 26 27 28 29 30 31 다음