machine-learning
Машиноведение и его классификация
Поиск…
Что такое машинное обучение?
Предлагаются два определения машинного обучения. Артур Самуил описал это как:
поле обучения, которое дает компьютерам возможность учиться, не будучи явно запрограммированным.
Это более старое, неформальное определение.
Том Митчелл предоставляет более современное определение:
Говорят, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если его производительность при выполнении задач в T, измеренная P, улучшается с опытом E.
Пример: игра в шашки.
E = опыт игры во многие игры шашек
T = задача игры в шашки.
P = вероятность того, что программа выиграет следующую игру.
В общем, любая проблема машинного обучения может быть отнесена к одной из двух широких классификаций:
- Контролируемое обучение
- Неконтролируемое обучение.
Что контролируется обучением?
Контролируемое обучение - это тип алгоритма машинного обучения, который использует известный набор данных (так называемый набор данных обучения) для прогнозирования.
Категория контролируемого обучения:
- Регрессия. В задаче регрессии мы пытаемся предсказать результаты в непрерывном выпуске, что означает, что мы пытаемся сопоставить входные переменные с некоторой непрерывной функцией.
- Классификация. В проблеме классификации мы вместо этого пытаемся предсказать результаты в дискретном выходе. Другими словами, мы пытаемся отобразить входные переменные в дискретные категории.
Пример 1:
Учитывая данные о размерах домов на рынке недвижимости, попробуйте предсказать их цену. Цена как функция размера - это непрерывный выход, поэтому это проблема регрессии.
Пример 2:
(a) Регрессия - для значений непрерывного ответа. Например, с учетом картины человека, мы должны предсказать их возраст на основе данной картины
(b) Классификация - для категориальных значений ответа, где данные могут быть разделены на конкретные «классы». Например, учитывая пациента с опухолью, мы должны предсказать, является ли опухоль злокачественной или доброкачественной.
Что такое неконтролируемое обучение?
Неконтролируемое обучение позволяет нам приблизиться к проблемам, которые мало или вообще не представляют, как выглядят наши результаты. Мы можем получить структуру из данных, где мы не обязательно знаем влияние переменных.
Пример:
Кластеризация: используется для анализа поисковых данных для поиска скрытых шаблонов или группировки данных. Возьмите коллекцию из 1 000 000 различных генов и найдите способ автоматически группировать эти гены в группы, которые каким-то образом похожи или связаны разными переменными, такими как продолжительность жизни, местоположение, роли и т. Д.