サーチ…


備考

定期的にポップアップするという前提は、英語のテキストのみを扱う場合、ASCII文字セット以外の文字に遭遇する可能性は低いということです。 Unicodeを正しく扱う上での問題を避けるために、ASCII以外の文字を取り除いたり、手紙のアクセントを削除したりするなどの作業をしたいと思っています。

これらの例は、この前提が間違っていることを示しています。また、英語のテキストでも、Unicode文字を正しく処理するように注意する必要があります。

発音欄

英語のテキストには時折分音があります。

  • née、café、entréeのようなローンの言葉
  • NoëlやChloëのような名前
  • モントリオールやケベックのような地名

絵文字

近年、ソーシャルメディアでは絵本が人気があります。

  • ☃: U+2603 - スノーマン
  • 😀: U+01F600 - グラインディングフェイス
  • 🐪: U+01F42A - ドラマチックキャメル

ほとんどの絵文字は基本多言語面の外にあることに注意してください。新しい追加の多くは、複数のコードポイントで構成されています。

  • 🇯🇵:フラグは、「地域記号インジケータ文字」のペアとして定義されます。
  • 🙋🏿:これは絵文字+スキントーンモディファイアです:🙋+
  • 😀︎またはvariation:Windows 10では、バリエーションセレクタ( U+FE0EまたはU+FE0F )を追加することで、絵文字が色付きか白黒かを指定できます。

句読点

ほとんどの書かれたテキストにはASCII文字セットの外にある句読点があります:

  • ダッシュ:enダッシュ - 、emダッシュ -
  • 引用符:引用符ではなく引用符
  • 省略記号...

特殊記号

使用中のいくつかの一般的なシンボルがあります:

  • 著作権表示©、および商標表示®™
  • ¼
  • 上付き文字。たとえば、平方メートルの略記はm²です。


Modified text is an extract of the original Stack Overflow Documentation
ライセンスを受けた CC BY-SA 3.0
所属していない Stack Overflow