수색…


소개

caret 은 기계 학습 문제에 필요한 데이터 처리를 돕는 R 패키지입니다. 그것은 분류 및 회귀 훈련을 의미합니다. 실제 데이터 세트의 모델을 만들 때 데이터 정리, 불완전한 관찰, 테스트 세트에서 모델의 유효성 검사, 다른 모델 비교와 같이 수행해야하는 실제 학습 알고리즘 이외의 작업이 있습니다.

caret 는 사용 된 실제 학습 알고리즘과 관계없이 이러한 시나리오에서 도움이됩니다.

전처리

캐럿의 전처리는 preProcess() 함수를 통해 수행됩니다. 행렬 또는 데이터 프레임 유형 객체 x 주어지면 preProcess() 는 훈련 데이터에 변형을 적용한 다음 테스트 데이터에 적용 할 수 있습니다.

preProcess() 함수의 핵심은 method 인수입니다. 메소드 조작은 다음 순서로 적용됩니다.

  1. 제로 분산 필터
  2. 제로에 가까운 분산 필터
  3. Box-Cox / Yeo-Johnson / 지수 변환
  4. 센터링
  5. 스케일링
  6. 범위
  7. 돌리기
  8. PCA
  9. ICA
  10. 공간 서명

아래에서는 mtcars 데이터 세트를 가져 와서 센터링, 스케일링 및 공간 부호 변환을 수행합니다.

auto_index <- createDataPartition(mtcars$mpg, p = .8,
                                  list = FALSE,
                                  times = 1)

mt_train <- mtcars[auto_index,]
mt_test <- mtcars[-auto_index,]

process_mtcars <- preProcess(mt_train, method = c("center","scale","spatialSign"))

mtcars_train_transf <- predict(process_mtcars, mt_train)
mtcars_test_tranf <- predict(process_mtcars,mt_test)


Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow