수색…


비고

정규적으로 팝업되는 가정은 영어 텍스트 만 처리 할 때 ASCII 문자 세트 외부의 문자를 만날 가능성이 없다는 것입니다. 유니 코드를 올바르게 처리 할 때 문제가 발생하지 않도록 비 ASCII 문자를 제거하거나 문자의 악센트를 제거하는 등의 일을하고 싶어합니다.

이 예는이 가정이 잘못되었음을 보여줍니다. 심지어 영어 텍스트의 경우에도 유니 코드 문자를 올바르게 처리해야합니다.

분별 기호

영어 텍스트는 때때로 발음 구별법을 사용합니다.

  • née, café, entrée와 같은 대출 단어
  • Noël 및 Chloë와 같은 이름
  • 몬트리올 및 퀘벡과 같은 장소 이름

그림 이모티콘

이모티콘은 요즘 소셜 미디어에 널리 사용됩니다.

  • : : U+2603 - 스노 만
  • 😀 : U+01F600 - 연마면
  • 🐪 : U+01F42A - U+01F42A 낙타

대부분의 이모티콘은 기본 다국어 차원 밖에 있습니다. 새로운 추가 기능은 하나 이상의 코드 포인트로 구성됩니다.

  • 🇯🇵 : 플래그는 "지역 기호 표시 문자"의 쌍으로 정의됩니다.
  • 🙋🏿 : 이모티콘과 스킨 톤 수정 자입니다. 🙋 +
  • 😀︎ 또는 variation : Windows 10에서는 변형 선택기 ( U+FE0E 또는 U+FE0F )를 추가하여 이모티콘이 컬러 또는 흑백인지 지정할 수 있습니다.

구두

거의 모든 서면 텍스트에는 ASCII 문자 세트 외부에 구두점이 있습니다.

  • 대시 : en 대시 - 및 em 대시 -
  • 따옴표 : "따옴표"보다는 "따옴표"
  • 줄임표 ...

특수 기호

사용중인 몇 가지 일반적인 기호가 있습니다.

  • 저작권 기호 © 및 상표 기호 ® ™
  • ¼ 같은 분수
  • 위 첨자. 예를 들어 평방 미터의 약자는 m²입니다.


Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow