Suche…


Bemerkungen

Eine regelmäßig auftauchende Annahme ist, dass beim Umgang mit nur englischem Text Zeichen außerhalb des ASCII-Zeichensatzes unwahrscheinlich sind. Um Probleme beim richtigen Umgang mit Unicode zu vermeiden, sind Menschen versucht, nicht ASCII-Zeichen zu entfernen oder Buchstaben mit Akzenten zu versehen.

Diese Beispiele zeigen, dass diese Annahme falsch ist, und selbst für englischen Text sollten Sie darauf achten, dass Unicode-Zeichen korrekt verarbeitet werden.

Diakritiker

Englischer Text hat gelegentlich Diakritiker.

  • Leihwörter wie zB Nee, Café, Vorspeise
  • Namen wie Noël und Chloë
  • Ortsnamen wie Montréal und Québec

Emoji

Emoji sind heutzutage bei Social Media sehr beliebt.

  • U: U+2603 - SNOWMAN
  • 😀: U+01F600 - GRINNENDES GESICHT
  • 🐪: U+01F42A - DROMEDARY CAMEL

Beachten Sie, dass sich die meisten Emojis außerhalb der Basic Multilingual Plane befinden. Viele neuere Ergänzungen bestehen aus mehr als einem Codepunkt:

  • A: Eine Flagge wird als Paar "Regionalzeichen" definiert.
  • 🙋🏿: Dies ist ein Emoji und ein Modifikator für die Hautfarbe: 🙋 + 🏿
  • 😀︎ oder 😀️: In Windows 10 können Sie festlegen, ob ein Emoji farbig oder schwarz / weiß ist, indem Sie eine Variationsauswahl anhängen ( U+FE0E oder U+FE0F )

Interpunktion

Fast jeder geschriebene Text enthält Satzzeichen, die außerhalb des ASCII-Zeichensatzes liegen:

  • Bindestriche: der en-Strich - und der em-Strich -
  • Anführungszeichen: "Anführungszeichen" statt "Anführungszeichen"
  • Die Ellipse…

Sonderzeichen

Es gibt einige übliche Symbole, die verwendet werden:

  • Copyright-Zeichen © und Markenzeichen ® ™
  • Bruchteile wie ¼
  • hochgestellte Abschriften Eine Abkürzung für Quadratmeter ist beispielsweise m².


Modified text is an extract of the original Stack Overflow Documentation
Lizenziert unter CC BY-SA 3.0
Nicht angeschlossen an Stack Overflow