Zoeken…


Invoering

NLP is een manier voor computers om op een slimme en nuttige manier betekenis uit menselijke taal te analyseren, te begrijpen en te ontlenen. Door gebruik te maken van NLP kunnen ontwikkelaars kennis organiseren en structureren om taken uit te voeren zoals automatische samenvatting, vertaling, entiteitsherkenning, relatie-extractie, sentimentanalyse, spraakherkenning en segmentering van onderwerpen.

Tekstovereenkomst of gelijkenis

Een van de belangrijke gebieden van NLP is het matchen van tekstobjecten om overeenkomsten te vinden. Belangrijke toepassingen van tekstafstemming zijn onder meer automatische spellingcorrectie, gegevensdeplicatie en genoomanalyse enz. Een aantal technieken voor tekstafstemming zijn beschikbaar, afhankelijk van de vereiste. Dus laten we hebben; Levenshtein Afstand

De Levenshtein-afstand tussen twee strings wordt gedefinieerd als het minimum aantal bewerkingen dat nodig is om de ene string in de andere te transformeren, waarbij de toegestane bewerkingshandelingen invoegen, verwijderen of vervangen van een enkel teken zijn.

Hierna volgt de implementatie voor efficiënte geheugenberekeningen.

def levenshtein(s1,s2): 
   
 if len(s1) > len(s2):
    s1,s2 = s2,s1 
distances = range(len(s1) + 1) 

for index2,char2 in enumerate(s2):
    newDistances = [index2+1]
    for index1,char1 in enumerate(s1):
        if char1 == char2:
            newDistances.append(distances[index1]) 
        else:
             newDistances.append(1 + min((distances[index1], distances[index1+1], newDistances[-1]))) 
             distances = newDistances 

             return distances[-1]

print(levenshtein("analyze","analyse"))


Modified text is an extract of the original Stack Overflow Documentation
Licentie onder CC BY-SA 3.0
Niet aangesloten bij Stack Overflow