Кодові таблиці символів в Visual C # (Sharp)

Для зберігання одного символу потрібно 16 біт памяті, а обсяг памяті, займатися рядком, залежить від кількості символів в рядку Наприклад, для зберігання рядки довжиною в 10 символів вимагається 160 біт памяті Тип string є ссочним типом

Так як для зберігання одного символу відводиться 16 біт, то текст можна зберігати у величезній різноманітності форматів У даному випадку застосовується стандартний формат, званий Unicode

Візьмемо, наприклад, букву а По-філософськи, яким чином ми знаємо, що а – це а Для нас це не становить особливої ​​праці, т к наш мозок натренований взаосвязивать обриси і весь зовнішній вигляд даної фігури з концепцією букви а Тепер подивимося на англійську букву, показану на рис 310

Р

&nbsp

Рис 310 Буква англійського алфавіту

Яка буква показана на рис 310 Виглядає, наче б буква Р, чи не так Але англійська Р– Це російська П У кожному з цих двох мов застосовується свій набір символів для позначення букв, і англійської букві Р відповідає російська П Відповідність всіх букв російського алфавіту англійської показано в табл 33

Для початківців вивчати англійську мову таблиця співвідношень припала б до речі З її допомогою можна швидко зорієнтуватися, яка буква або комбіне букв англійського алфавіту відповідає певній російської букві Коьютери також потребують шпаргалці такого виду, т к вони не розуміють букв, а тільки числа Тому в компютерах застосовуються таблиці перетворень, за допомогою яких набір букв співвідноситься з набором чисел

Існує кілька типів таблиць перетворень, однією з них є код ASCII (American Standard Code for Information Interchange, Американський Стандар код обміну інформацією) Так, наприклад, в ASCII англійська літера а співвідносячи з числом 97 Але з ASCII мається проблема – в той час як цей код прекрасно працює з англійським алфавітом, з іншими алфавітами він працює огидно Код ASCII був розширений для роботи з західноєвропейськими мовами, але з такими мовами як китайська, російська або арабська у нього є проблеми

Таблиця 33Співвідношення російських букв англійським

1

З цієї причини в NET застосовується кодування Unicode Це кодування определт набір таблиць перетворення, які співвідносять все алфавіти світу з опреденним набором чисел

У більшості випадків вам не доведеться мати справу з Unicode, т к все, повязане з кодуваннями, NET виконує прозоро для програміста Річ було ссем по-іншому багато років тому, коли програмістам доводилося випоять самостійно всю повязану з таблицями перетворень роботу Так що ви можете вважати, що вам пощастило: вам не доведеться пізнати всю радість такої роботи при розробці багатомовних додатків

Джерело: Гросс К С # 2008: Пер з англ – СПб: БХВ-Петербург, 2009 – 576 е: ил – (Самовчитель)

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*