пример «эйч-ти»). Кроме законов фонетики, морфологии, лек¬
сики, "есть еще и законы грамматики, требующие согласова¬
ния времен, падежей и т. д. Все это накладывает на язык
множество «запретов», ограничений. И тем самым создаст
«избыточность» языка (если есть местоимение «мы», то и гла¬
гол будет во множественном числе и т. д.). Для английского
языка она равна примерно 75 процентам. То есть примерно три
четверти букв в английском тексте являются «лишними»,
появление их вызвано не стремлением передать информацию,
а законами грамматики, лексики и т. д. Конечно, это сокращает
во много раз число возможных сообщений и позволяет находить
«расстояние единственности» для криптограмм.
ФОРМУЛЫ ТИПОВ ПИСЬМА
Возможно ли применить методику Шеннона к древним тек¬
стам? Разумеется, все исходные величины — и число дешифруе¬
мых знаков, и число их возможных «референтов», и величина
избыточности — будут иными. Но общий подход остается тем
же. Справедливой остается и формула, по которой определяет¬
ся «расстояние единственности», объем текста, при котором
возможна его однозначная расшифровка.
Лингвисты определили величину избыточности в самых раз¬
ных языках мира: в русском и армянском, немецком и азер¬
байджанском, самоанском и румынском. И везде она колеб¬
лется в пределах 70—80 процентов, т. е. в любом тексте, записан¬
ном буквами около трех четвертей этпх букв — «лишние», они
диктуются законами языка. Меньше всего различных букв
в гаванском алфавите — всего лишь 12 согласных и 7 гласных.
Больше всего букв и в алфавитах, разработанных советскими
языковедами для языков Кавказа — свыше пятидесяти. Не¬
трудно определить и чпсло возможпых «референтов» знаков
любого алфавита, которыми будут звуки языка. Меньше всего
их в языке арапта, одного из австралийских племеи — всего
десять звуков, десять фонем. Больше всего — в тех же языках
Кавказа (до восьмидесяти фопем!).
Зная эти цифры, нетрудно определить, какой величины дол¬
жен быть алфавитный текст, чтобы мы могли дать его одно¬
значную дешифровку. Для гавайского алфавита получаем
20 букв, для русского — 70, армянского — 80. Допустим, мы
встретились с самым трудным случаем, когда текст написан
на каком-то из кавказских языков, где может быть до 80 зву¬
ков «референтов», а число неизвестных знаков письма превы-
174
шает 50, как в нерасшифрованном агванском письме. Величи¬
на «расстояния единствеипостп» будет равна здесь 200 знакам,
в десять раз превышая величину для гавайского алфавита. Но
это — предел. Значит, если в нашем распоряжении есть текст,
записанный нерасшифрованным алфавитом, и его объем равен
200 и более знакам, можно с уверенностью утверждать: дешиф¬
ровка этого текста возможна, ибо она имеет только одно «ре¬
шение», текст можно прочесть только одним способом.
Но ведь последователям приходится иметь дело пе только
и ие столько с алфавитами, ио п со слоговыми и смешанными,
словесно-слоговыми системами письма, а также логографиче-
скими письменностями, типа таигутской пли китайской.
Определить число разных знаков в системе письма нетруд¬
но. Можно рассчитать, скольким слогам плп словам должны
соответствовать эти знаки. Гораздо трудней вычислить вели¬
чину «избыточности» для древних письменностей. Но и эта
задача разрешима.
Для логографпческого (знак-слово) письма избыточность
равна примерно 50 процентам. Это означает, что «лишними»
в тексте, написанном логограммами, будет половина всех зна¬
ков. Логографня оказывается гораздо более экономным письмом,
чем алфавит (правда, эта экономия достигается дорогой ценой'
сравните несколько десятков знаков в алфавитах и тысячи
и тысячи знаков-логограмм в китайском и тангутском письме).
Для того чтобы одпозначпо расшифровать текст, записанный
зпаками-логограммами, on должеп быть очень большим, поряд¬
ка миллиона знаков.
Величина избыточности слогового письма находится где-то
между величинами алфавита и логографип (слоговое ппсьмо
более «ёмко», чем буквенное, но менее «ёмко», чем логографн-
ческое), т. е. между 50 и 70 процентами. В среднем можно при¬
нять величину, равную 60 процентам. Для определения числа
«референтов» слоговых знаков нужно принимать во внимание
тип слогового письма. Если все знаки передают лпшь открытые
слоги («гласный» и «согласный-f гласный»), их будет гораздо
меньше, чем в случае употребления открытых и закрытых сло¬
гов. От этого зависит и величина «расстояния единственности»,
опт? с"™абаРиев первого типа она будет равна примерно
300—500 знакам, для второго — порядка 5—8 тысяч знаков
(ведь и число возможных слогов в них измеряется многими
и многими сотнями!).
Словесно-слоговое письмо состоит из знаков двух типов.
«Смешанным» будет и способ определения объема текста.'
нужно рассчитать «расстояние единственности» отдельно для
175