территории Египта, Синайского полуострова, Палестины, Си¬
рии, письмена бохайцев, кпданей, чжурчжэней на Дальнем Во¬
стоке и загадочные геометрические знаки, покрывающие более
пятисот сланцевых плит, найденных в различных частях Испа¬
нии.
«РАССТОЯНИЕ ЕДИНСТВЕННОСТИ»
Перед нами «текст», состоящий из одного единственного
знака. Можно лп расшифровать его? Разумеется, нельзя. Ведь
знак может быть, в принципе, любой буквой неизвестного ал¬
фавита. И не только буквой, ito и слоговым знаком, пли лого¬
граммой, пли идеограммой.
А если текст состоит из 10 знаков? 100? 1000? 10 000? Когда
мы можем решить, что объем текста достаточен для его де¬
шифровки? Первую попытку ответить на этот вопрос предпри¬
нял американский инженер и математик Клод Шеннон, созда¬
тель теории информации.
В годы второй мировой войны остро стоял вопрос о созда¬
нии надежных шифров. Необходимо было решить и противопо¬
ложную задачу: расшифровывать секретные донесения против¬
ника. В Соединенных Штатах над решением этой проблемы
работали многие выдающиеся ученые, в том числе и Клод
Шеннон. Результатом его исследований стал секретный доклад
«Математическая теория криптографии» (тайнописи). После
окончания войны доклад был рассекречен и лег в основу рабо¬
ты Шеннона «Теория связи в секретных системах», перевод
которой был опубликован и в нашей стране.
«Расстояние единственности» — так назывался в этой рабо¬
те миинмальпый объем текста, при котором возможно одно,
единствеппо правильное, «решение», расшифровка криптограм¬
мы. Допустим, мы имеем шифровку на английском языке, где
буквы заменены цифрами (вспомните «Золотого жука» Эдга-
=н+і*со-і:в4п
В=-НІХХІ/=ІІпХ
. *ѲѲ-*ХХ'//ІЮ=Э-Х
Нумііднйскап надпись
172
pa По, который, кстати, был одним из пионеров математической
методики расшифровки криптограмм). В принципе, мы можем
прочитать эту (и любую другую) шифровку путем простого
перебора. Имеется 26 различных цифр. Им соответствует
26 букв английского алфавита. Последовательно пробуя вари¬
анты (является ли знак 01 буквой «а»? буквой «в»? буквой
«с»? и т. д.), мы можем натолкнуться на верное решение. Но оно
будет единственно правильным лишь тогда, когда нам в руки
попал достаточно большой текст. В противном случае мы можем
прочесть шифровку несколькими способами. И все они будут
правильны с точки зрения английского языка, все они будут
составлять осмысленные тексты.
Шейной показал, что для английского языка и алфавита
■«расстояние единственности» равно примерно тридцати знакам.
Если мы имеем текст такой (пли большей) длины, мы вправе
считать, что он имеет одно и только одно «решение». Если дли¬
на текста меньше тридцати знаков, возможно несколько его
«прочтений». И чем короче текст, тем больше вариантов «про¬
чтения» ои допускает.
Например, если в тексте всего лишь восемь знаков, мы мо¬
жем сопоставить с ним более 40 000 комбинаций английских
букв, которые могут соответствовать этим знакам. Примерно
Ve этих комбинаций будет правильной, т. е. будет образовывать
слова английского языка. Иными словами, возможно около
5 000 «решений» криптограммы (т. е. эти восемь знаков могут
быть прочтепы и как слово the first, и как district, и как
in danger и т. д. и т. п.). А это говорит о том, что практически
мы не в состоянии расшифровать криптограмму — слишком уж
много вариантов ее решения, слишком уж мало знаков входит
в нее.
Как же Шенпону удалось определить «расстояние единст¬
венности», величину текста, достаточного для дешифровки?
Величина эта слагается из трех показателей. Прежде всего —
общее число разных знаков, чтение которых нам предстоит
установить. Затем — число «референтов», количество букв
(или звуков), которым должны соответствовать знаки шифров¬
ки (например, в случае, разбиравшемся выше, число цифр-зна¬
ков равно 26, число «референтов», букв английского алфавита,
также равно 26). И, наконец, необходимо знать третью величи¬
ну,— так называемую «избыточность языка».
Не всякое сочетание букв образует английское слово (так
же, как русское, немецкое и т. д.). Одни буквы и сочетания
букв употребляются в английском очень часто (например,
«ти-эйч»), другие — редко, а третьи не встречаются вообще (на-
173