Recherche…


Remarques

Une hypothèse qui surgit régulièrement est que lorsque l'on ne traite que du texte anglais, il est peu probable que des caractères extérieurs au jeu de caractères ASCII apparaissent. Pour éviter les problèmes liés au traitement correct d'Unicode, les utilisateurs sont tentés de supprimer des caractères non-ASCII ou de supprimer des accents sur des lettres.

Ces exemples montrent que cette hypothèse est fausse, et même pour le texte anglais, vous devez prendre soin de gérer correctement les caractères Unicode.

Diacritiques

Le texte anglais a occasionnellement des signes diacritiques.

  • Mots d'emprunt, comme née, café, entrée
  • Des noms comme Noël et Chloë
  • Les noms de lieux, comme Montréal et Québec

Emoji

Les Emoji sont très populaires auprès des médias sociaux ces jours-ci.

  • ☃: U+2603 - SNOWMAN
  • 😀: U+01F600 - VISAGE GRINNING
  • 🐪: U+01F42A - CAMEL DROMEDAIRE

Notez que la plupart des emoji sont en dehors du plan multilingue de base. De nombreux ajouts récents se composent de plusieurs points de code:

  • Flag: Un drapeau est défini comme une paire de "lettres indicatrices de symboles régionaux"
  • 🙋🏿: Ceci est un emoji plus un modificateur de tonalité de peau: 🙋 + 🏿
  • 😀︎ ou 😀️: Windows 10 vous permet de spécifier si un emoji est coloré ou noir / blanc en ajoutant un sélecteur de variation ( U+FE0E ou U+FE0F )

Ponctuation

Presque tous les textes écrits comportent des signes de ponctuation qui ne font pas partie du jeu de caractères ASCII:

  • tirets: les en-dash -, et les em dash -
  • Les guillemets: "guillemets" plutôt que "guillemets"
  • Les points de suspension…

Symboles spéciaux

Quelques symboles communs sont utilisés:

  • signe de copyright ©, et signes de marque déposée ® ™
  • des fractions comme ¼
  • indices supérieurs. Par exemple, un raccourci pour les mètres carrés est le m².


Modified text is an extract of the original Stack Overflow Documentation
Sous licence CC BY-SA 3.0
Non affilié à Stack Overflow