수색…


다른 알파벳의 문자 맞추기

아래 예제는 Ruby에서 제공되지만, 동일한 matchers는 모든 최신 언어로 제공되어야합니다.

지저분한 인공 지능으로 제작 된 "AℵNaïve" 라는 문자열이 있다고 가정 해 봅시다. 글자로 구성되어 있지만 일반 \w 정규식은 많이 일치하지 않습니다.

▶ "AℵNaïve"[/\w+/]
#⇒ "A"

유니 코드 문자를 결합 표시와 일치시키는 올바른 방법은 \X 를 사용하여 제자 클러스터를 지정하는 것입니다. 루비에 대한 경고가 있습니다. Ruby의 정규식 엔진 인 Onigmo 여전히 grapheme 클러스터의 오래된 정의를 사용합니다 . 유니 코드 표준 Annex 29에 정의 된 Extended Grapheme Cluster 로 업데이트되지 않았습니다.

: 그래서, 루비에 대해 우리는 문제를 해결 할 수 \p{L} 그 위에 결합 구별 악센트 실패에 대한 저장, 거의 잘 할 것입니다 i :

▶ "AℵNaïve"[/\p{L}+/]
#⇒ "AℵNai"

"기호 기호"를 표현식에 추가함으로써 마침내 모든 것을 일치시킬 수 있습니다.

▶ "AℵNaïve"[/[\p{L}\p{M}]+/]
#⇒ "AℵNaïve"


Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow