machine-learning
L'apprentissage automatique et sa classification
Recherche…
Qu'est-ce que l'apprentissage automatique?
Deux définitions de l'apprentissage automatique sont proposées. Arthur Samuel l'a décrit comme:
le domaine d'étude qui donne aux ordinateurs la capacité d'apprendre sans être explicitement programmés.
C'est une définition plus ancienne et informelle.
Tom Mitchell fournit une définition plus moderne:
Un programme informatique est censé apprendre de l’expérience E en ce qui concerne une classe de tâches T et la mesure de la performance P, si sa performance aux tâches dans T, mesurée par P, s’améliore avec l’expérience E.
Exemple: jouer aux dames.
E = l'expérience de jouer à de nombreux jeux de dames
T = la tâche de jouer aux dames.
P = la probabilité que le programme gagne le prochain match.
En général, tout problème d'apprentissage automatique peut être classé dans l'une des deux grandes catégories suivantes:
- Enseignement supervisé
- Apprentissage non supervisé
Qu'est-ce que l'apprentissage supervisé?
L'apprentissage supervisé est un type d'algorithme d'apprentissage automatique qui utilise un ensemble de données connu (appelé ensemble de données d'apprentissage) pour effectuer des prédictions.
Catégorie d'apprentissage supervisé:
- Régression: Dans un problème de régression, nous essayons de prédire les résultats dans une sortie continue, ce qui signifie que nous essayons de mapper les variables d'entrée à une fonction continue.
- Classification: Dans un problème de classification, nous essayons plutôt de prédire les résultats dans une sortie discrète. En d'autres termes, nous essayons de mapper les variables d'entrée en catégories distinctes.
Exemple 1:
En fonction des données sur la taille des maisons sur le marché immobilier, essayez de prévoir leur prix. Le prix en fonction de la taille est une sortie continue, il s'agit donc d'un problème de régression.
Exemple 2:
(a) Régression - Pour les valeurs de réponse continue. Par exemple, à partir d'une image d'une personne, il faut prévoir son âge sur la base de l'image donnée
(b) Classification - pour les valeurs de réponse catégorielles, où les données peuvent être séparées en «classes» spécifiques. Par exemple, pour un patient atteint d'une tumeur, il faut prédire si la tumeur est maligne ou bénigne.
Qu'est-ce que l'apprentissage non supervisé?
L'apprentissage non supervisé nous permet d'aborder les problèmes avec peu ou pas d'idée de nos résultats. Nous pouvons dériver une structure à partir de données où nous ne connaissons pas nécessairement l'effet des variables.
Exemple:
Clustering: est utilisé pour l'analyse de données exploratoires afin de trouver des modèles cachés ou un regroupement de données. Prenez une collection de 1 000 000 de gènes différents et trouvez un moyen de regrouper automatiquement ces gènes en groupes similaires ou liés par différentes variables, telles que la durée de vie, l'emplacement, les rôles, etc.