unicode
अंग्रेजी पाठ केवल ASCII नहीं है
खोज…
टिप्पणियों
एक धारणा जो नियमित रूप से पॉप होती है वह यह है कि केवल अंग्रेजी पाठ के साथ काम करते समय, यह ASCII वर्ण सेट के बाहर पात्रों का सामना करने की संभावना नहीं है। यूनिकोड को सही ढंग से संभालने के साथ समस्याओं से बचने के लिए, लोगों को गैर-एएससीआईआई अक्षर छीनने, या अक्षरों पर किसी भी उच्चारण को हटाने जैसे काम करने के लिए लुभाया जाता है।
ये उदाहरण बताते हैं कि यह धारणा गलत है, और यहां तक कि अंग्रेजी पाठ के लिए भी आपको यूनिकोड वर्णों को सही ढंग से संभालने के लिए ध्यान रखना चाहिए।
विशेषक
अंग्रेजी के पाठ में कभी-कभार होने वाले डायटिक्स हैं।
- ऋण शब्द, जैसे कि, कैफे, एन्ट्री
- नाम, जैसे नोएल और क्लो
- जगह के नाम, जैसे मॉन्ट्रियल और क्यूबेक
इमोजी
इमोजी इन दिनों सोशल मीडिया पर काफी लोकप्रिय हैं।
- 260:
U+2603
- स्नोमैन -
U+01F600
:U+01F600
- ग्रेडिंग फेस -
U+01F42A
:U+01F42A
- DROMEDARY CAMEL
ध्यान दें कि ज्यादातर इमोजी बेसिक मल्टीलिंगुअल प्लेन के बाहर हैं। बहुत से नए जोड़ में एक से अधिक कोड बिंदु होते हैं:
- Is: एक ध्वज को "क्षेत्रीय प्रतीक सूचक अक्षरों" की एक जोड़ी के रूप में परिभाषित किया गया है
- An: यह एक इमोजी प्लस स्किन टोन संशोधक है: an + an
- 😀︎ या an: विंडोज १० आपको यह निर्दिष्ट करने की अनुमति देता है कि कोई इमोजी रंग का है या काला / सफ़ेद है, एक वेरिएशन चयनकर्ता (
U+FE0E
याU+FE0F
) कोU+FE0F
विराम चिह्न
लगभग सभी लिखित पाठ में विराम चिह्न हैं जो ASCII वर्ण सेट के बाहर हैं:
- डैश: एन डैश - और एम डैश -
- उद्धरण चिह्न: "उद्धरण" के बजाय "उद्धरण"
- दीर्घवृत्त…
विशेष प्रतीक
उपयोग में कुछ सामान्य प्रतीक हैं:
- कॉपीराइट साइन ©, और ट्रेडमार्क संकेत ® ™
- अंश ¼ जैसे
- सुपरस्क्रिप्ट। उदाहरण के लिए, वर्ग मीटर के लिए एक आशुलिपि वर्ग मीटर है।