Поиск…


Что такое машинное обучение?

Предлагаются два определения машинного обучения. Артур Самуил описал это как:

поле обучения, которое дает компьютерам возможность учиться, не будучи явно запрограммированным.

Это более старое, неформальное определение.

Том Митчелл предоставляет более современное определение:

Говорят, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если его производительность при выполнении задач в T, измеренная P, улучшается с опытом E.

Пример: игра в шашки.

E = опыт игры во многие игры шашек

T = задача игры в шашки.

P = вероятность того, что программа выиграет следующую игру.

В общем, любая проблема машинного обучения может быть отнесена к одной из двух широких классификаций:

  1. Контролируемое обучение
  2. Неконтролируемое обучение.

Что контролируется обучением?

Контролируемое обучение - это тип алгоритма машинного обучения, который использует известный набор данных (так называемый набор данных обучения) для прогнозирования.

Категория контролируемого обучения:

  1. Регрессия. В задаче регрессии мы пытаемся предсказать результаты в непрерывном выпуске, что означает, что мы пытаемся сопоставить входные переменные с некоторой непрерывной функцией.
  2. Классификация. В проблеме классификации мы вместо этого пытаемся предсказать результаты в дискретном выходе. Другими словами, мы пытаемся отобразить входные переменные в дискретные категории.

Пример 1:

Учитывая данные о размерах домов на рынке недвижимости, попробуйте предсказать их цену. Цена как функция размера - это непрерывный выход, поэтому это проблема регрессии.

Пример 2:

(a) Регрессия - для значений непрерывного ответа. Например, с учетом картины человека, мы должны предсказать их возраст на основе данной картины

(b) Классификация - для категориальных значений ответа, где данные могут быть разделены на конкретные «классы». Например, учитывая пациента с опухолью, мы должны предсказать, является ли опухоль злокачественной или доброкачественной.

Что такое неконтролируемое обучение?

Неконтролируемое обучение позволяет нам приблизиться к проблемам, которые мало или вообще не представляют, как выглядят наши результаты. Мы можем получить структуру из данных, где мы не обязательно знаем влияние переменных.

Пример:

Кластеризация: используется для анализа поисковых данных для поиска скрытых шаблонов или группировки данных. Возьмите коллекцию из 1 000 000 различных генов и найдите способ автоматически группировать эти гены в группы, которые каким-то образом похожи или связаны разными переменными, такими как продолжительность жизни, местоположение, роли и т. Д.



Modified text is an extract of the original Stack Overflow Documentation
Лицензировано согласно CC BY-SA 3.0
Не связан с Stack Overflow