nltk
पीओएस टैगिंग
खोज…
परिचय
भाषण टैगिंग का हिस्सा शब्दों के टुपल्स और भाषण के कुछ हिस्सों को बनाता है। यह एक वाक्य में शब्दों को संज्ञा, विशेषण, क्रिया, आदि के रूप में लेबल करता है। यह तनाव और भी बहुत कुछ कर सकता है। ये टैग आपके मूल प्रशिक्षण डेटा में जो कुछ भी मतलब था। आप अपने प्रशिक्षण डेटा में अपने स्वयं के टैग का आविष्कार करने के लिए स्वतंत्र हैं, जब तक आप उनके उपयोग में सुसंगत हैं। प्रशिक्षण डेटा आमतौर पर बनाने के लिए बहुत काम लेता है, इसलिए आमतौर पर पहले से मौजूद कॉर्पस का उपयोग किया जाता है। ये आमतौर पर पेन ट्रीबैंक और ब्राउन कॉर्पस का उपयोग करते हैं।
टिप्पणियों
नोट करने के लिए महत्वपूर्ण बिंदु
- चर शब्द टोकनों की एक सूची है।
- भले ही सूची शब्द में आइटम i एक टोकन है, लेकिन एकल टोकन को टैग करने से शब्द का प्रत्येक अक्षर टैग हो जाएगा।
- nltk.tag.pos_tag_ स्वीकार करें a
- टोकन की सूची - फिर अलग करें और उसके तत्वों को टैग करें या
- स्ट्रिंग की सूची
- आपको एक शब्द के लिए टैग नहीं मिल सकता है, इसके बजाय आप इसे एक सूची में रख सकते हैं।
- पीओएस टैग
मूल उदाहरण
import nltk
from nltk.tokenize import sent_tokenize, word_tokenize
text = 'We saw the yellow dog'
word = word_tokenize(text)
tag1 = nltk.pos_tag(word)
print(tag1)
Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow