machine-learning
Maskininlärning och klassificering
Sök…
Vad är maskininlärning?
Två definitioner av maskininlärning erbjuds. Arthur Samuel beskrev det som:
studieområdet som ger datorer förmågan att lära sig utan att uttryckligen programmeras.
Detta är en äldre, informell definition.
Tom Mitchell ger en mer modern definition:
Ett datorprogram sägs lära sig av erfarenhet E med avseende på vissa klasser av uppgifter T och prestandamått P, om dess prestanda vid uppgifter i T, mätt med P, förbättras med erfarenhet E.
Exempel: spela brickor.
E = upplevelsen av att spela många brickspel
T = uppgiften att spela brickor.
P = sannolikheten för att programmet vinner nästa spel.
I allmänhet kan alla maskininlärningsproblem tilldelas en av två breda klassificeringar:
- Övervakad inlärning
- Oövervakat lärande.
Vad är övervakat lärande?
Övervakad inlärning är en typ av maskininlärningsalgoritm som använder en känd datauppsättning (kallad träningsdataset) för att göra förutsägelser.
Kategori övervakat lärande:
- Regression: I ett regressionsproblem försöker vi förutsäga resultat inom en kontinuerlig utgång, vilket innebär att vi försöker kartlägga inmatningsvariabler till någon kontinuerlig funktion.
- Klassificering: I ett klassificeringsproblem försöker vi istället förutsäga resultat i en diskret utgång. Med andra ord försöker vi kartlägga inmatningsvariabler i diskreta kategorier.
Exempel 1:
Med tanke på storleken på husen på fastighetsmarknaden kan du försöka förutsäga deras pris. Pris som en funktion av storleken är en kontinuerlig utgång, så detta är ett regressionsproblem.
Exempel 2:
(a) Regression - För värden för kontinuerligt svar. Till exempel med en bild av en person måste vi förutsäga deras ålder utifrån den givna bilden
(b) Klassificering - för kategoriska svarvärden, där data kan delas upp i specifika "klasser". Till exempel med tanke på en patient med en tumör måste vi förutsäga om tumören är malign eller godartad.
Vad är undervisning utan tillsyn?
Oövervakat inlärning tillåter oss att närma oss problem med liten eller ingen aning om hur våra resultat ska se ut. Vi kan härleda struktur från data där vi inte nödvändigtvis vet effekten av variablerna.
Exempel:
Clustering: Används för undersökande dataanalys för att hitta dolda mönster eller gruppering i data. Ta en samling med 1 000 000 olika gener och hitta ett sätt att automatiskt gruppera dessa gener i grupper som på något sätt liknar eller är relaterade till olika variabler, såsom livslängd, plats, roller och så vidare.