machine-learning
Machine learning en zijn classificatie
Zoeken…
Wat is machine learning?
Er worden twee definities van Machine Learning aangeboden. Arthur Samuel beschreef het als:
het vakgebied dat computers de mogelijkheid biedt om te leren zonder expliciet te worden geprogrammeerd.
Dit is een oudere, informele definitie.
Tom Mitchell biedt een modernere definitie:
Van een computerprogramma wordt gezegd dat het leert van ervaring E met betrekking tot een bepaalde klasse van taken T en prestatiemaatstaf P, als zijn prestaties bij taken in T, gemeten door P, verbeteren met ervaring E.
Voorbeeld: dammen spelen.
E = de ervaring met het spelen van veel damspellen
T = het spelen van schijven.
P = de kans dat het programma de volgende game zal winnen.
Over het algemeen kan elk probleem met machine learning worden toegewezen aan een van de twee brede classificaties:
- Leren onder toezicht
- Leren zonder toezicht.
Wat is begeleid leren?
Supervised learning is een type machine learning-algoritme dat een bekende gegevensset (de trainingsgegevensset) gebruikt om voorspellingen te doen.
Categorie begeleid leren:
- Regressie: in een regressieprobleem proberen we resultaten te voorspellen binnen een continue uitvoer, wat betekent dat we proberen invoervariabelen toe te wijzen aan een continue functie.
- Classificatie: in een classificatieprobleem proberen we in plaats daarvan resultaten in een discrete output te voorspellen. Met andere woorden, we proberen invoervariabelen in afzonderlijke categorieën in kaart te brengen.
Voorbeeld 1:
Probeer de prijs te voorspellen op basis van gegevens over de grootte van huizen op de onroerendgoedmarkt. Prijs als functie van grootte is een continue uitvoer, dus dit is een regressieprobleem.
Voorbeeld 2:
(a) Regressie - voor waarden van continue respons. Als we bijvoorbeeld een foto van een persoon krijgen, moeten we hun leeftijd voorspellen op basis van de gegeven foto
(b) Classificatie - voor categorische responswaarden, waarbij de gegevens kunnen worden gescheiden in specifieke "klassen". Als we bijvoorbeeld een patiënt met een tumor krijgen, moeten we voorspellen of de tumor kwaadaardig of goedaardig is.
Wat is leren zonder toezicht?
Zonder toezicht leren stelt ons in staat om problemen met weinig of geen idee te benaderen hoe onze resultaten eruit moeten zien. We kunnen structuur ontlenen aan gegevens waarbij we niet noodzakelijk het effect van de variabelen kennen.
Voorbeeld:
Clustering: wordt gebruikt voor verkennende gegevensanalyse om verborgen patronen of groepering in gegevens te vinden. Neem een verzameling van 1.000.000 verschillende genen en vind een manier om deze genen automatisch te groeperen in groepen die op een of andere manier vergelijkbaar zijn of gerelateerd zijn door verschillende variabelen, zoals levensduur, locatie, rollen, enzovoort.