R Language
탈자 부호
수색…
소개
caret
은 기계 학습 문제에 필요한 데이터 처리를 돕는 R 패키지입니다. 그것은 분류 및 회귀 훈련을 의미합니다. 실제 데이터 세트의 모델을 만들 때 데이터 정리, 불완전한 관찰, 테스트 세트에서 모델의 유효성 검사, 다른 모델 비교와 같이 수행해야하는 실제 학습 알고리즘 이외의 작업이 있습니다.
caret
는 사용 된 실제 학습 알고리즘과 관계없이 이러한 시나리오에서 도움이됩니다.
전처리
캐럿의 전처리는 preProcess()
함수를 통해 수행됩니다. 행렬 또는 데이터 프레임 유형 객체 x
주어지면 preProcess()
는 훈련 데이터에 변형을 적용한 다음 테스트 데이터에 적용 할 수 있습니다.
preProcess()
함수의 핵심은 method
인수입니다. 메소드 조작은 다음 순서로 적용됩니다.
- 제로 분산 필터
- 제로에 가까운 분산 필터
- Box-Cox / Yeo-Johnson / 지수 변환
- 센터링
- 스케일링
- 범위
- 돌리기
- PCA
- ICA
- 공간 서명
아래에서는 mtcars 데이터 세트를 가져 와서 센터링, 스케일링 및 공간 부호 변환을 수행합니다.
auto_index <- createDataPartition(mtcars$mpg, p = .8,
list = FALSE,
times = 1)
mt_train <- mtcars[auto_index,]
mt_test <- mtcars[-auto_index,]
process_mtcars <- preProcess(mt_train, method = c("center","scale","spatialSign"))
mtcars_train_transf <- predict(process_mtcars, mt_train)
mtcars_test_tranf <- predict(process_mtcars,mt_test)
Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow