수색…
소개
음성 태그 지정의 일부는 단어와 부분의 튜플 을 만듭니다. 문장의 단어를 명사, 형용사, 동사 등으로 표시합니다. 또한 시제 등으로 레이블을 붙일 수 있습니다. 이 태그는 원래 교육 데이터에서 의미 한 바를 의미합니다. 사용법이 일관성이있는 한 교육 데이터에 자신의 태그를 자유롭게 작성할 수 있습니다. 교육 데이터는 일반적으로 생성하기 위해 많은 작업이 필요하므로 일반적으로 기존의 코퍼스가 사용됩니다. 이들은 보통 Penn Treebank와 Brown Corpus를 사용합니다.
비고
유의 사항
- 변수 워드 는 토큰 목록입니다.
- 목록 단어의 항목 i 는 토큰이지만 단일 토큰을 태그하면 단어의 각 문자에 태그가 지정됩니다.
- nltk.tag.pos_tag_ accept a
- 토큰 목록 - 요소를 분리하고 태그를 지정하거나
- 문자열 목록
- 한 단어에 대한 태그를 가져올 수 없으며 대신 목록에 넣을 수 있습니다.
- POS 태그
기본 예제
import nltk
from nltk.tokenize import sent_tokenize, word_tokenize
text = 'We saw the yellow dog'
word = word_tokenize(text)
tag1 = nltk.pos_tag(word)
print(tag1)
Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow