unicode
Englischer Text ist nicht nur ASCII
Suche…
Bemerkungen
Eine regelmäßig auftauchende Annahme ist, dass beim Umgang mit nur englischem Text Zeichen außerhalb des ASCII-Zeichensatzes unwahrscheinlich sind. Um Probleme beim richtigen Umgang mit Unicode zu vermeiden, sind Menschen versucht, nicht ASCII-Zeichen zu entfernen oder Buchstaben mit Akzenten zu versehen.
Diese Beispiele zeigen, dass diese Annahme falsch ist, und selbst für englischen Text sollten Sie darauf achten, dass Unicode-Zeichen korrekt verarbeitet werden.
Diakritiker
Englischer Text hat gelegentlich Diakritiker.
- Leihwörter wie zB Nee, Café, Vorspeise
- Namen wie Noël und Chloë
- Ortsnamen wie Montréal und Québec
Emoji
Emoji sind heutzutage bei Social Media sehr beliebt.
- U:
U+2603
- SNOWMAN - 😀:
U+01F600
- GRINNENDES GESICHT - 🐪:
U+01F42A
- DROMEDARY CAMEL
Beachten Sie, dass sich die meisten Emojis außerhalb der Basic Multilingual Plane befinden. Viele neuere Ergänzungen bestehen aus mehr als einem Codepunkt:
- A: Eine Flagge wird als Paar "Regionalzeichen" definiert.
- 🙋🏿: Dies ist ein Emoji und ein Modifikator für die Hautfarbe: 🙋 + 🏿
- 😀︎ oder 😀️: In Windows 10 können Sie festlegen, ob ein Emoji farbig oder schwarz / weiß ist, indem Sie eine Variationsauswahl anhängen (
U+FE0E
oderU+FE0F
)
Interpunktion
Fast jeder geschriebene Text enthält Satzzeichen, die außerhalb des ASCII-Zeichensatzes liegen:
- Bindestriche: der en-Strich - und der em-Strich -
- Anführungszeichen: "Anführungszeichen" statt "Anführungszeichen"
- Die Ellipse…
Sonderzeichen
Es gibt einige übliche Symbole, die verwendet werden:
- Copyright-Zeichen © und Markenzeichen ® ™
- Bruchteile wie ¼
- hochgestellte Abschriften Eine Abkürzung für Quadratmeter ist beispielsweise m².