खोज…


टिप्पणियों

एक धारणा जो नियमित रूप से पॉप होती है वह यह है कि केवल अंग्रेजी पाठ के साथ काम करते समय, यह ASCII वर्ण सेट के बाहर पात्रों का सामना करने की संभावना नहीं है। यूनिकोड को सही ढंग से संभालने के साथ समस्याओं से बचने के लिए, लोगों को गैर-एएससीआईआई अक्षर छीनने, या अक्षरों पर किसी भी उच्चारण को हटाने जैसे काम करने के लिए लुभाया जाता है।

ये उदाहरण बताते हैं कि यह धारणा गलत है, और यहां तक कि अंग्रेजी पाठ के लिए भी आपको यूनिकोड वर्णों को सही ढंग से संभालने के लिए ध्यान रखना चाहिए।

विशेषक

अंग्रेजी के पाठ में कभी-कभार होने वाले डायटिक्स हैं।

  • ऋण शब्द, जैसे कि, कैफे, एन्ट्री
  • नाम, जैसे नोएल और क्लो
  • जगह के नाम, जैसे मॉन्ट्रियल और क्यूबेक

इमोजी

इमोजी इन दिनों सोशल मीडिया पर काफी लोकप्रिय हैं।

  • 260: U+2603 - स्नोमैन
  • U+01F600 : U+01F600 - ग्रेडिंग फेस
  • U+01F42A : U+01F42A - DROMEDARY CAMEL

ध्यान दें कि ज्यादातर इमोजी बेसिक मल्टीलिंगुअल प्लेन के बाहर हैं। बहुत से नए जोड़ में एक से अधिक कोड बिंदु होते हैं:

  • Is: एक ध्वज को "क्षेत्रीय प्रतीक सूचक अक्षरों" की एक जोड़ी के रूप में परिभाषित किया गया है
  • An: यह एक इमोजी प्लस स्किन टोन संशोधक है: an + an
  • 😀︎ या an: विंडोज १० आपको यह निर्दिष्ट करने की अनुमति देता है कि कोई इमोजी रंग का है या काला / सफ़ेद है, एक वेरिएशन चयनकर्ता ( U+FE0E या U+FE0F ) को U+FE0F

विराम चिह्न

लगभग सभी लिखित पाठ में विराम चिह्न हैं जो ASCII वर्ण सेट के बाहर हैं:

  • डैश: एन डैश - और एम डैश -
  • उद्धरण चिह्न: "उद्धरण" के बजाय "उद्धरण"
  • दीर्घवृत्त…

विशेष प्रतीक

उपयोग में कुछ सामान्य प्रतीक हैं:

  • कॉपीराइट साइन ©, और ट्रेडमार्क संकेत ® ™
  • अंश ¼ जैसे
  • सुपरस्क्रिप्ट। उदाहरण के लिए, वर्ग मीटर के लिए एक आशुलिपि वर्ग मीटर है।


Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow