258
Приложение
Перечень кодовых страниц
Первая часть приложения содержит примеры кириллических кодиро¬
вок с «древности» до наших дней.
Исторически первая группа кодировок, появившаяся задолго до воз¬
никновения персональных компьютеров,— кодировки KOI (Kod dia
Obmena i Obrabotki Informacii). Для кодирования использовались 7 бит.
Идея этого типа кодировки восходит к примитивному способу записи
русских слов латинскими буквами (типа Privet, Vasya!), который иногда
до сих пор используется в Internet-общении (например, в Chat). Иными
словами, расположение кириллических символов соответствует располо¬
жению соответствующих латинских букв противоположного регистра
(строчные русские на месте прописных латинских - табл. 1). При отсут¬
ствии русского знакогенератора текст не только получался разборчивым
(вместо «Здравствуйте» — «zDRAWSTWUJTE»), но и легко отличался
от английского текста за счет переключения регистра. В первых вариан¬
тах КОІ буква «ё» отсутствует.
ГОСТ 19768-74 (1974 г.) закрепил еще два варианта KOI: КОІ7, где со¬
вмещены русские и латинские буквы (табл. 2), но используются только
заглавные литеры, и КО 18 — первый восьмибитный вариант этой коди¬
ровки. Следующий вариант был дополнен буквой «ё». Стандарт КОІ в на¬
стоящее время используется в Unix-станциях и широко распространен
в Internet. Утверждения многих «фанатов» о полной его унифицирован¬
ности являются безусловной ложью. Как и любая популярная кодировка,
КОІ служит основой для творчества, а значит, для производства новых,
слегка отличающихся кодировок. В настоящее время существует несколь¬
ко десятков вариантов КОІ и продолжают появляться (например,
в Internet) шрифты с теми или иными изменениями кодировки.
В середине восьмидесятых годов комитетом ЕСМА принят очередной
вариант KOI8 (табл. 3). Это уже действительно панъевропейская кирилли¬
ца, а не просто буквы русского языка: кодировка была дополнена украинс¬
кими, белорусскими, сербохорватскими и македонскими знаками.
Немногим позже фирмой Relcom, которая тогда была «первой россий¬
ской ласточкой» в Internet (newsgroups relcom.*), был создан вариант
KOI8, содержащий, кроме русских букв, псевдографику и математические
символы, но не содержащий знаков других кириллических алфавитов.
(Это и есть KOI8 в узком смысле слова — табл. 4.) В 90-х годах появляется
украинский вариант КО 18, содержащий все дополнительные литеры ук¬
раинского и белорусского языков (табл. 5). Завершением развития коди¬
ровки КОІ явилось появление KOI8-Unified (табл. 6), созданной Fingertip
Перечень кодовых страниц
259
Software. Это расширенный вариант KOI8, принятой ЕСМА, содержащий,
например, все украинские символы. В настоящее время актуальны KOI8-R
(Relcom) и KOI8-RU. Несмотря на то что ранние варианты КОІ представ¬
ляют в основном исторический интерес, периодически обнаруживаются
важные тексты, набранные в одной из этих кодировок, даже в семибит¬
ной КОІ, состоящей из заглавных букв.
Отдельную линию развития имеют кодировки, базирующиеся на ГОСТ
19768-87 («основная» кодировка — табл. 7). Расположение букв было приве¬
дено в соответствие с русским алфавитным порядком. Весь алфавит распо¬
ложен монолитно, за исключением букв «ё» и «Ё». Это расположение симво¬
лов взято за основу при построении финального варианта стандарта
ISO-8859-5 в 1988 г. (табл. 8). Именно эта кодировка используется в операци¬
онной системе Solaris фирмы Sun. Данный стандарт впоследствии стал осно¬
вой для построения кириллического диапазона Unicode (табл. 23). Учтите,
что Word использует при поиске (ЛиХХХХХ) и вставке ({Symbol \uXXXXX})
символа десятичные, а не шестнадцатеричные номера.
Вместе с «основной» ГОСТ предусматривает «альтернативную» коди¬
ровку (табл. 11). Она базировалась на кодовой таблице СР-437, зашитой
в знакогенератор видеоадаптера (от MDA до самых современных 3D-yc-
корителей). Расположение элементов псевдографики (которой здесь до¬
вольно много, так что хватало даже для несложных рисунков) оставлено
неизменным, что исключает искажение, например, сеток таблиц, схем и т. д.
Массив букв при этом получился разорванным на две части. Данная ко¬
дировка оказалась очень популярной, и возникло большое число ее вари¬
антов. В табл. 12 приведены шесть примеров таких кодировок: а - укра¬
инская (стандарт РСТ УРСР 2018-91 С.З, содержащий букву «Г»), b -
кодировка первых русских версий DOS — СР-866 (поддерживаемая в
Windows), с - широко применявшаяся во времена верстки в среде DOS
кодировка издательства «Юридическая литература», d - кодировка, соот¬
ветствующая по структуре «альтернативной» и полностью совпадающая
по набору символов с KOI8-R, e - «модифицированная альтернативная»
с «ё», f - «модифицированная альтернативная» без «ё».
Еще одна кодировка, основанная на СР-437 (сохраняющая неизменной
расположение элементов псевдографики), использовалась на ком¬
пьютерах ЕС-1840, а также на некоторых компьютерах Правец, Mazovia,
Estel (табл. 10). Кодировка, соответствующая болгарскому стандарту МІС,
также использовалась на некоторых компьютерах Правец и пордолжает
использоваться в Болгарском Linux (табл. 9).
Кодировка Microsoft Windows 3.0 Latin-1 основана на стандарте ISO-
8859-1. На ней базируется Windows 3.1 Latin-1, то есть СР-1252, а на
17*