Поиск…


Вступление

caret - это пакет R, который помогает в обработке данных, необходимой для проблем машинного обучения. Это означает классификацию и регрессионную подготовку. При создании моделей для реального набора данных существуют некоторые задачи, отличные от реального алгоритма обучения, который необходимо выполнить, например, очистка данных, обработка неполных наблюдений, проверка нашей модели на тестовом наборе и сравнение разных моделей.

caret помогает в этих сценариях, независимо от используемых алгоритмов обучения.

предварительная обработка

Предварительная обработка в карете выполняется с помощью функции preProcess() . Для объекта x типа матрицы или типа данных preProcess() применяет преобразования к данным обучения, которые затем могут применяться к данным тестирования.

Сердцем функции preProcess() является аргумент method . Операции метода применяются в следующем порядке:

  1. Фильтр нулевой дисперсии
  2. Фильтр дисперсии с нулевым значением
  3. Box-Cox / Yeo-Johnson / экспоненциальная трансформация
  4. Центрирование
  5. пересчет
  6. Спектр
  7. вменение в вину
  8. PCA
  9. ICA
  10. Пространственный знак

Ниже мы берем набор данных mtcars и выполняем центрирование, масштабирование и пространственное преобразование знака.

auto_index <- createDataPartition(mtcars$mpg, p = .8,
                                  list = FALSE,
                                  times = 1)

mt_train <- mtcars[auto_index,]
mt_test <- mtcars[-auto_index,]

process_mtcars <- preProcess(mt_train, method = c("center","scale","spatialSign"))

mtcars_train_transf <- predict(process_mtcars, mt_train)
mtcars_test_tranf <- predict(process_mtcars,mt_test)


Modified text is an extract of the original Stack Overflow Documentation
Лицензировано согласно CC BY-SA 3.0
Не связан с Stack Overflow