unicode
Il testo inglese non è solo ASCII
Ricerca…
Osservazioni
Un'ipotesi che appare regolarmente è che quando si ha a che fare solo con il testo in inglese, è improbabile che incontri caratteri al di fuori del set di caratteri ASCII. Per evitare problemi con la gestione di Unicode correttamente, le persone sono tentate di fare cose come la rimozione di caratteri non ASCII o la rimozione di qualsiasi accento sulle lettere.
Questi esempi mostrano che questa ipotesi è sbagliata, e anche per il testo inglese dovresti fare attenzione a gestire correttamente i caratteri Unicode.
segni diacritici
Il testo inglese ha i segni diacritici occasionali.
- Parole di prestito, come née, café, entrée
- Nomi come Noël e Chloë
- Metti nomi, come Montréal e Québec
emoji
Emoji è abbastanza popolare con i social media in questi giorni.
- ☃:
U+2603
- PUPAZZO DI NEVE - 😀:
U+01F600
- VISO DI GRINVIO - 🐪:
U+01F42A
- CAMMELLO DROMEDARIO
Nota che la maggior parte delle emoji è al di fuori del piano multilingue di base. Molte nuove aggiunte consistono in più di un punto di codice:
- 🇯🇵: Una bandiera è definita come una coppia di "lettere indicatrici di simboli regionali"
- 🙋🏿: Questa è un'emoji più un modificatore della tonalità della pelle: 🙋 + 🏿
- 😀︎ o 😀️: Windows 10 consente di specificare se un'emoji è colorata o nero / bianco aggiungendo un selettore di variazione (
U+FE0E
oU+FE0F
)
Punteggiatura
Quasi tutti i testi scritti presentano segni di punteggiatura al di fuori del set di caratteri ASCII:
- trattini: il trattino - e il trattino -
- Virgolette: "virgolette" anziché "virgolette"
- I puntini di sospensione ...
Simboli speciali
Ci sono alcuni simboli comuni in uso:
- segno d'autore © e segni di marchio ® ™
- frazioni come ¼
- apici. Ad esempio, una scorciatoia per metri quadrati è m².