machine-learning 튜토리얼
기계 학습 시작하기
수색…
비고
기계 학습은 컴퓨터 프로그래밍의 과학 (및 예술)으로 데이터에서 배울 수 있습니다.
보다 공식적인 정의 :
컴퓨터가 명시 적으로 프로그래밍하지 않고도 학습 할 수있는 능력을 제공하는 분야입니다. 아서 사무엘, 1959 년
보다 엔지니어링 지향적 인 정의 :
컴퓨터 프로그램은 P에 의해 측정 된 T에 대한 성능이 경험에 따라 향상된다면 어떤 작업 T와 성능 측정 P에 관한 경험 E로부터 학습한다고 말해진다. E. Tom Mitchell, 1997
출처 : "Aurélien Géron (O'Reilly)의 Scikit-Learn 및 TensorFlow를 사용한 실습 기계. 저작권 2017 Aurélien Géron, 978-1-491-96229-9. "
기계 학습 (ML)은 인공 지능 연구에서 창출 된 컴퓨터 과학 분야입니다. 다른 형태의 분석보다 기계 학습의 강점은 숨겨진 통찰력을 발견하고 미래의 보이지 않는 입력 (일반화)의 결과를 예측하는 능력에 있습니다. 연산이 명시 적으로 선언되는 반복 알고리즘과 달리 기계 학습 알고리즘은 확률 이론의 개념을 빌려 통계 모델을 선택, 평가 및 개선합니다.
Python을 사용한 설치 또는 설정
1) scikit learn
scikit-learn은 SciPy 위에 구축되고 3 절 BSD 라이센스하에 배포되는 기계 학습을위한 Python 모듈입니다. 지원 벡터 머신, 랜덤 포리스트, 그레디언트 부스팅, k-means 및 DBSCAN을 비롯한 다양한 분류, 회귀 및 클러스터링 알고리즘을 제공하며 Python 숫자 및 과학 라이브러리 NumPy 및 SciPy와 상호 운용되도록 설계되었습니다.
scikit-learn의 현재 안정 버전 에는 다음이 필요합니다 .
- 파이썬 (> = 2.6 또는> = 3.3),
- NumPy (> = 1.6.1),
- SciPy (> = 0.9).
대부분의 설치 pip
파이썬 패키지 관리자는 python과 모든 의존성을 설치할 수 있습니다 :
pip install scikit-learn
그러나 Linux 시스템의 경우 가능한 빌드 프로세스를 피하기 위해 conda
패키지 관리자를 사용하는 것이 좋습니다
conda install scikit-learn
scikit-learn
을 가지고 있는지 확인하려면 쉘에서 실행하십시오 :
python -c 'import sklearn; print(sklearn.__version__)'
Windows 및 Mac OSX 설치 :
캐노피 (Canopy) 와 아나콘다 (Anaconda) 는 윈도우 용 과학 파이썬 라이브러리, 리눅스 용 맥 OSX (Mac OSX)와 더불어 최근 버전의 scikit-learn 을 제공한다.
공식 소스 코드 저장소 : https://github.com/scikit-learn/scikit-learn
2) 지능형 컴퓨팅을위한 Numenta 플랫폼
지능형 컴퓨팅을위한 Numenta 플랫폼 (NuPIC)은 HTM 학습 알고리즘을 구현하는 기계 인텔리전스 플랫폼입니다. HTM은 대뇌 피질의 상세한 계산 이론입니다. HTM의 핵심에는 공간적 및 시간적 패턴을 저장하고 호출하는 시간 기반 연속 학습 알고리즘이 있습니다. NuPIC은 스트리밍 데이터 소스의 비정상 탐지 및 예측과 같은 다양한 문제에 적합합니다.
NuPIC 바이너리를 사용할 수있는 대상은 다음과 같습니다.
Linux x86 64bit
OS X 10.9
OS X 10.10
Windows 64 비트
모든 운영 체제에 NuPIC을 설치하려면 다음과 같은 종속성이 필요합니다.
- 파이썬 2.7
- pip> = 8.1.2
- setuptools> = 25.2.0
- 휠> = 0.29.0
- 쉰
- gcc (4.8+) 또는 clang과 같은 C ++ 11 컴파일러
추가 OS X 요구 사항 :
- Xcode 명령 행 도구
NuPIC을 설치하려면 다음을 실행하십시오.
pip install nupic
공식 소스 코드 저장소 : https://github.com/numenta/nupic
3) 나일강
Nilearn은 NeuroImaging 데이터에서 빠르고 쉬운 통계 학습을위한 Python 모듈입니다. 예측 모델링, 분류, 디코딩 또는 연결 분석과 같은 응용 프로그램과 함께 다 변수 통계를 위해 scikit-learn Python 도구 상자를 활용합니다.
소프트웨어를 사용하는 데 필요한 종속성은 다음과 같습니다.
- Python> = 2.6,
- setuptools
- Numpy> = 1.6.1
- SciPy> = 0.9
- Scikit-learn> = 0.14.1
- 니벨 (Nibabel)> = 1.1.0
nilearn 플로팅 기능을 사용하거나 예제를 실행하는 경우 matplotlib> = 1.1.1이 필요합니다.
테스트를 실행하려면 nose> = 1.2.1 및 coverage> = 3.6이 필요합니다.
먼저 위에 나열된 모든 종속성을 설치했는지 확인하십시오. 그런 다음 명령 프롬프트에서 다음 명령을 실행하여 nilearn을 설치할 수 있습니다.
pip install -U --user nilearn
공식 소스 코드 저장소 : https://github.com/nilearn/nilearn/
4) 아나콘다 사용
많은 과학적 파이썬 라이브러리가 Anaconda에서 즉시 사용할 수 있습니다. 여기 에서 설치 파일을 얻을 수 있습니다. Anaconda를 사용하면 많은 패키지를 설치 및 구성하지 않고 BSD 라이센스를 취득하며 Python 3 및 Python 2에서 사용할 수있는 간단한 설치 프로세스를 사용할 수 있습니다. 반면에 유연성이 떨어집니다. 예를 들어, 일부 최첨단 Python 패키지는 numpy와 Anaconda가 설치된 다른 버전을 사용할 수 있습니다. 그러나이 단점은 다른 파이썬 설치를 별도로 사용하여 처리 할 수 있습니다 (예 : Linux 및 MAC에서는 기본값).
Anaconda 설치 프로그램은 설치 위치 선택을 요구하고 PATH 추가 옵션을 묻습니다. PATH에 Anaconda를 추가하면 OS가 Anaconda Python을 기본값으로 찾을 것입니다. 따라서 수정 및 향후 설치는이 Python 버전에서만 가능합니다.
안타깝게하려면 Anaconda를 설치 한 후 PATH에 추가하십시오. 입력 할 경우 터미널을 통해 Ubuntu 14.04를 사용하십시오.
python
Borilla, Anaconda Python이 기본 파이썬이므로 많은 라이브러리를 즉시 사용하여 즐거움을 시작할 수 있습니다. 그러나 이전 Python을 사용하려면
/usr/bin/python
Anaconda는 짧게 말하면 파이썬으로 기계 학습 및 데이터 분석을 시작하는 가장 빠른 방법 중 하나입니다.
R 언어를 사용한 설치 또는 설정
패키지 는 R 함수, 데이터 및 잘 정의 된 형식의 컴파일 된 코드 모음입니다. 공용 (개인) 저장소는 R 패키지 모음을 호스트하는 데 사용됩니다. R 패키지의 가장 큰 컬렉션은 CRAN에서 제공됩니다. 가장 인기있는 R 기계 학습 패키지 중 일부는 다음과 같습니다.
1) rpart
설명 : 분류, 회귀 및 생존 트리에 대한 재귀 적 분할. Breiman, Friedman, Olshen 및 Stone의 1984 년 도서 기능 대부분의 구현.
다음 코드를 사용하여 CRAN에서 설치할 수 있습니다.
install.packages("rpart")
패키지를로드하십시오.
library(rpart)
공식 출처 : https://cran.r-project.org/web/packages/rpart/index.html
2) e1071
설명 : 잠재 클래스 분석, 단시간 푸리에 변환, 퍼지 클러스터링, 지원 벡터 머신, 최단 경로 계산, 백킹 클러스터링, 순진 베이 즈 분류기 등의 기능
CRAN에서 설치 :
install.packages("e1071")
패키지로드 중 :
library(e1071)
공식 출처 : https://cran.r-project.org/web/packages/e1071/index.html
3) randomForest
설명 : 임의의 입력을 사용하여 나무의 숲을 기반으로 분류 및 회귀.
CRAN에서 설치 :
install.packages("randomForest")
패키지로드 중 :
library(randomForest)
공식 출처 : https://cran.r-project.org/web/packages/randomForest/index.html
4) 캐럿
설명 : 분류 및 회귀 모델을 훈련하고 플로팅하기위한 기타 기능.
CRAN에서 설치 :
install.packages("caret")
패키지로드 중 :
library(caret)
공식 출처 : https://cran.r-project.org/web/packages/caret/index.html