русс | укр

Мови програмуванняВідео уроки php mysqlПаскальСіАсемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование


Linux Unix Алгоритмічні мови Архітектура мікроконтролерів Введення в розробку розподілених інформаційних систем Дискретна математика Інформаційне обслуговування користувачів Інформація та моделювання в управлінні виробництвом Комп'ютерна графіка Лекції


Н.В. Аншакова, М.Б. Беляева


Дата додавання: 2014-11-27; переглядів: 840.


Юніко́д, (англ. Unicode), УНІфіковане КОДування — це промисловий стандарт, розроблений для уможливлення використання символів (графічних знаків) всіх писемних систем світу та узгодженого представлення (репрезентації) і обробки комп’ютерами. Удосконалений сумісно з стандартом Універсальний Набір Символів (Universal Character Set - UCS) Юнікод складається з асортименту символів, методології кодування і комплекту (набору) стандартів кодування символів, комплекту кодових таблиць для посилань на зображення символів, списку властивостей символів таких, наприклад, як верхній і нижній регістр, комплект довідкових даних комп’ютерних файлів, правил нормалізації, декомпозиції, зіставлення і зображення (рендерингу).

Стандарт запропонувала в 1991 році організація Unicode Consortium, яка об’єднує найбільші ІТ-компанії (корпорації). Unicode Consortium - неприбуткова (некомерційна) організація, яка координує розвиток Юнікоду, має амбітну мету замінити в кінцевому підсумку існуючі системи кодування символів Юнікодом і його системою стандартів UTF (Unicode Transformation Format). Успіхи Юнікоду в уніфікації наборів символів призвели до його розповсюдження і домінуючого використання в інтернаціоналізації і локалізації програмного забезпечення комп’ютерів. Стандарт був використаний у багатьох новітніх технологіях, напр. XML, мові програмування JavaScript і сучасних операційних системах.

Юнікод знімає старе обмеження на кодування символів лише одним байтом. Замість цього використовується 17 просторів, кожен з яких визначає 65536 кодів і дає можливість описати максимум 17 * 216 різних символів. Basic Multilingual Plane (BMP) — Основна Багатомовна Площина, містить майже всі символи, що коли-небудь використовуватимуться.

Юнікод має декілька реалізацій, але найпоширенішими є дві: UTF (Unicode Transformation Format) та UCS (Universal Character Set). Число після UTF визначає кількість біт виділених під один юніт, а число після UCS визначає кількість байтів. Універсальний набір символів задає однозначну відповідність символів кодам — елементам кодового простору, тобто невід’ємним цілим числам. UTF-8 став найпоширенішим для інтернаціональних кодувань.

UTF-8 є системою кодування зі змінною довжиною кодування символів, це означає що для кодування символів він використовує від 1 до 4 байт на символ. Так перший байт UTF-8 використовується для кодування ASCII, що дає повну сумісність з кодами ASCII. Перекодування кодів ASCII у кодах UTF-8 для латинських символів дуже не збільшить розмір даних, бо використовується тільки один бай на символ. В інших мовах, де напр. для кодування використовувати два байти на символ, це кодування збільшує розмір даних на приблизно 50% або більше.

UTF-8 дозволяє працювати в стандартизованому міжнародно прийнятому багатомовному середовищі, з порівняно незначним збільшенням обсягу даних. UTF-8 являє собою ідеальний спосіб передачі символів через Інтернет, електронну пошту, чат, тощо.

Коди в стандарті Unicode поділені на декілька областей. Область з кодами від U+0000 до U+007F (про запис виду «U+xxxx» дивись нижче в розділі «Кодовий простір») містить символи набору ASCII. Далі розміщені області знаків різних писемностей, знаки пунктуації і технічні символи. Частина кодів зарезервована для використання в майбутньому. Для символів кирилиці виділені коди від U+0400 до U+052F.

 

Н.В. Аншакова, М.Б. Беляева

Базовые конструкции и
стандартные типы данных в Паскале

 

(Turbo Pascal 7.0. Начальный курс. Практикум.)

 

Уфа

РИО БашГУ

 

 


УДК

ББК

Рецензенты:

1. заведующий кафедрой Математики и Информатики МПСИ, кандидат технических наук, доцент Т.Х. Агишев;

2. заведующий кафедрой ЕМД МГОПУ им. Шолохова, кандидат физико-математических наук, доцент А.В. Дорофеев.

 


<== попередня лекція | наступна лекція ==>
Веб-служба | Паскаль программалау тілі


Онлайн система числення Калькулятор онлайн звичайний Науковий калькулятор онлайн