machine-learning
Apprendimento automatico e classificazione
Ricerca…
Cos'è l'apprendimento automatico?
Sono disponibili due definizioni di Machine Learning. Arthur Samuel l'ha descritto come:
il campo di studio che dà ai computer la possibilità di apprendere senza essere programmato esplicitamente.
Questa è una definizione più vecchia e informale.
Tom Mitchell fornisce una definizione più moderna:
Si dice che un programma per computer apprende dall'esperienza E in relazione ad alcune classi di compiti T e alla misura della prestazione P, se le sue prestazioni nei compiti in T, misurate da P, migliorano con l'esperienza E.
Esempio: giocare a dama.
E = l'esperienza di giocare a molti giochi di dama
T = il compito di giocare a dama.
P = la probabilità che il programma vincerà la prossima partita.
In generale, qualsiasi problema di apprendimento automatico può essere assegnato a una delle due ampie classificazioni:
- Apprendimento supervisionato
- Apprendimento senza supervisione.
Cos'è l'apprendimento supervisionato?
L'apprendimento supervisionato è un tipo di algoritmo di apprendimento automatico che utilizza un set di dati noto (chiamato set di dati di addestramento) per effettuare previsioni.
Categoria di apprendimento supervisionato:
- Regressione: in un problema di regressione, stiamo cercando di prevedere i risultati all'interno di un output continuo, il che significa che stiamo cercando di mappare le variabili di input su una funzione continua.
- Classificazione: in un problema di classificazione, stiamo invece cercando di prevedere i risultati in un output discreto. In altre parole, stiamo cercando di mappare le variabili di input in categorie discrete.
Esempio 1:
Dati i dati sulla dimensione delle case sul mercato immobiliare, prova a prevedere il loro prezzo. Il prezzo in funzione delle dimensioni è un risultato continuo, quindi questo è un problema di regressione.
Esempio 2:
(a) Regressione - Per i valori di risposta continua. Ad esempio, data l'immagine di una persona, dobbiamo prevedere la loro età sulla base dell'immagine data
(b) Classificazione - per valori di risposta categoriali, in cui i dati possono essere separati in "classi" specifiche. Ad esempio, dato un paziente con un tumore, dobbiamo prevedere se il tumore è maligno o benigno.
Cos'è l'apprendimento senza supervisione?
L'apprendimento senza supervisione ci permette di affrontare i problemi con poca o nessuna idea di come dovrebbero essere i nostri risultati. Possiamo ricavare la struttura da dati in cui non conosciamo necessariamente l'effetto delle variabili.
Esempio:
Clustering: viene utilizzato per l'analisi dei dati esplorativi per trovare schemi nascosti o raggruppare i dati. Prendi una raccolta di 1.000.000 di geni diversi e trova un modo per raggruppare automaticamente questi geni in gruppi che sono in qualche modo simili o correlati da diverse variabili, come durata della vita, posizione, ruoli e così via.