machine-learning
Natuurlijke taalverwerking
Zoeken…
Invoering
NLP is een manier voor computers om op een slimme en nuttige manier betekenis uit menselijke taal te analyseren, te begrijpen en te ontlenen. Door gebruik te maken van NLP kunnen ontwikkelaars kennis organiseren en structureren om taken uit te voeren zoals automatische samenvatting, vertaling, entiteitsherkenning, relatie-extractie, sentimentanalyse, spraakherkenning en segmentering van onderwerpen.
Tekstovereenkomst of gelijkenis
Een van de belangrijke gebieden van NLP is het matchen van tekstobjecten om overeenkomsten te vinden. Belangrijke toepassingen van tekstafstemming zijn onder meer automatische spellingcorrectie, gegevensdeplicatie en genoomanalyse enz. Een aantal technieken voor tekstafstemming zijn beschikbaar, afhankelijk van de vereiste. Dus laten we hebben; Levenshtein Afstand
De Levenshtein-afstand tussen twee strings wordt gedefinieerd als het minimum aantal bewerkingen dat nodig is om de ene string in de andere te transformeren, waarbij de toegestane bewerkingshandelingen invoegen, verwijderen of vervangen van een enkel teken zijn.
Hierna volgt de implementatie voor efficiënte geheugenberekeningen.
def levenshtein(s1,s2):
if len(s1) > len(s2):
s1,s2 = s2,s1
distances = range(len(s1) + 1)
for index2,char2 in enumerate(s2):
newDistances = [index2+1]
for index1,char1 in enumerate(s1):
if char1 == char2:
newDistances.append(distances[index1])
else:
newDistances.append(1 + min((distances[index1], distances[index1+1], newDistances[-1])))
distances = newDistances
return distances[-1]
print(levenshtein("analyze","analyse"))