Ricerca…


Osservazioni

Un'ipotesi che appare regolarmente è che quando si ha a che fare solo con il testo in inglese, è improbabile che incontri caratteri al di fuori del set di caratteri ASCII. Per evitare problemi con la gestione di Unicode correttamente, le persone sono tentate di fare cose come la rimozione di caratteri non ASCII o la rimozione di qualsiasi accento sulle lettere.

Questi esempi mostrano che questa ipotesi è sbagliata, e anche per il testo inglese dovresti fare attenzione a gestire correttamente i caratteri Unicode.

segni diacritici

Il testo inglese ha i segni diacritici occasionali.

  • Parole di prestito, come née, café, entrée
  • Nomi come Noël e ​​Chloë
  • Metti nomi, come Montréal e Québec

emoji

Emoji è abbastanza popolare con i social media in questi giorni.

  • ☃: U+2603 - PUPAZZO DI NEVE
  • 😀: U+01F600 - VISO DI GRINVIO
  • 🐪: U+01F42A - CAMMELLO DROMEDARIO

Nota che la maggior parte delle emoji è al di fuori del piano multilingue di base. Molte nuove aggiunte consistono in più di un punto di codice:

  • 🇯🇵: Una bandiera è definita come una coppia di "lettere indicatrici di simboli regionali"
  • 🙋🏿: Questa è un'emoji più un modificatore della tonalità della pelle: 🙋 + 🏿
  • 😀︎ o 😀️: Windows 10 consente di specificare se un'emoji è colorata o nero / bianco aggiungendo un selettore di variazione ( U+FE0E o U+FE0F )

Punteggiatura

Quasi tutti i testi scritti presentano segni di punteggiatura al di fuori del set di caratteri ASCII:

  • trattini: il trattino - e il trattino -
  • Virgolette: "virgolette" anziché "virgolette"
  • I puntini di sospensione ...

Simboli speciali

Ci sono alcuni simboli comuni in uso:

  • segno d'autore © e segni di marchio ® ™
  • frazioni come ¼
  • apici. Ad esempio, una scorciatoia per metri quadrati è m².


Modified text is an extract of the original Stack Overflow Documentation
Autorizzato sotto CC BY-SA 3.0
Non affiliato con Stack Overflow