खोज…


परिचय

एनएलपी कंप्यूटर के लिए एक स्मार्ट और उपयोगी तरीके से मानव भाषा से विश्लेषण, समझने और अर्थ प्राप्त करने का एक तरीका है। एनएलपी का उपयोग करके, डेवलपर्स स्वचालित संक्षेपण, अनुवाद, नामित इकाई मान्यता, संबंध निष्कर्षण, भावना विश्लेषण, भाषण मान्यता और विषय विभाजन जैसे कार्यों को करने के लिए ज्ञान को व्यवस्थित और संरचना कर सकते हैं।

पाठ मिलान या समानता

एनएलपी के महत्वपूर्ण क्षेत्रों में से एक समानता खोजने के लिए पाठ वस्तुओं का मिलान है। पाठ मिलान के महत्वपूर्ण अनुप्रयोगों में स्वचालित वर्तनी सुधार, डेटा डी-डुप्लीकेशन और जीनोम विश्लेषण आदि शामिल हैं। आवश्यकता के आधार पर कई पाठ मिलान तकनीक उपलब्ध हैं। तो चलो; लेवेंसाइटिन दूरी

दो तारों के बीच लेवेन्सहाइट दूरी को एक स्ट्रिंग को दूसरे में बदलने के लिए आवश्यक संपादन की न्यूनतम संख्या के रूप में परिभाषित किया गया है, जिसमें स्वीकार्य संपादन संचालन सम्मिलन, विलोपन या एकल वर्ण का प्रतिस्थापन है।

निम्नलिखित कुशल स्मृति संगणना के लिए कार्यान्वयन है।

def levenshtein(s1,s2): 
   
 if len(s1) > len(s2):
    s1,s2 = s2,s1 
distances = range(len(s1) + 1) 

for index2,char2 in enumerate(s2):
    newDistances = [index2+1]
    for index1,char1 in enumerate(s1):
        if char1 == char2:
            newDistances.append(distances[index1]) 
        else:
             newDistances.append(1 + min((distances[index1], distances[index1+1], newDistances[-1]))) 
             distances = newDistances 

             return distances[-1]

print(levenshtein("analyze","analyse"))


Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow