ЛИТЕРАТУРА / КНИГИ
Трактат о дешифровке криптографических сообщений
Метод, предложенный Аль-Кинди легче объяснить с точки зрения русского алфавита. Прежде всего, необходимо изучить достаточно длинный отрывок текста на русском языке, или несколько отрывков разных текстов, чтобы установить частоту появлений каждой буквы алфавита. В русском языке о — самая частая буква, после неё е, затем а и так далее, как указано в таблице. Потом изучим зашифрованный текст и установим частоту появлений каждого символа в нём. Например, если самый частый символ в зашифрованном тексте Ю, то, вероятнее всего, его следуют заменить на букву о. Если второй по частоте символ зашифрованного текста Э, то его, вероятно, следует заменить на е, и так далее. Благодаря методу Аль-Кинди, известному как частотный криптоанализ, не нужно проверять каждый из миллиардов потенциальных ключей. Вместо этого можно расшифровать сообщение просто проанализировав частоту символов в нём.
Буква | Частота % | Буква | Частота % | Буква | Частота % | Буква | Частота % |
---|---|---|---|---|---|---|---|
О | 11,08 | Р | 4,45 | Ы | 1,96 | Х | 0,89 |
Е, Ё | 8,41 | В | 4,33 | Ь | 1,92 | Ш | 0,81 |
А | 7,92 | К | 3,36 | З | 1,75 | Ю | 0,61 |
И | 6,83 | М | 3,26 | Г | 1,74 | Э | 0,38 |
Н | 6,72 | Д | 3,05 | Б | 1,71 | Щ | 0,37 |
Т | 6,18 | П | 2,81 | Ч | 1,47 | Ц | 0,36 |
С | 5,33 | У | 2,80 | Й | 1,12 | Ф | 0,19 |
Л | 5,00 | Я | 2,13 | Ж | 1,05 | Ъ | 0,02 |
Тем не менее частотный криптоанализ не решает полностью задачу взлома моноалфавитных шифров. Его применимость зависит от величины и характера текста. Средние частоты букв какого-либо языка не всегда будут соответствовать частотам букв конкретного текста. Например, краткое сообщение, в котором обсуждается влияние атмосферы на движение зебр в Африке «Из-за озоновых дыр от Занзибары до Замбии и Заира зебры бегают зигзагами», если будет зашифрованно моноалфавитным шифром, не удастся дешифровать с помощью простого частотного криптоанализа. Так как буква з в этом сообщении встречается на порядок чаще, чем в простой речи. В технических текстах редкая буква ф может стать довольно частой в связи с частым использованием таких слов, как функция, дифференциал, диффузия, коэффициент и т. п..
Если не удаётся расшифровать криптограмму с помощью простого частотного криптоанализа (например если сообщение слишком короткое), Ал-Кинди предлагает использовать характерные сочетания букв или, наоборот, несочетаемость определённых букв друг с другом. Например, наиболее распространённые биграммы (группы из двух букв) русского языка: ст, но, ен, то, на, ов, ни, ра, во, ко. Важна статистика сочетаемости гласных и согласных букв. Например перед буквами ь, ы, ъ и после э не могут стоять гласные, а после любой гласной буквы следует согласная с вероятностью 87 %. Так же подсказкой для криптоаналитика могут быть общепринятые вступительные слова, которые используются почти в каждом языке. Например в арабском часто употреблялось «Во имя Бога, милостивого и милосердного» (بسم الله الرحمن الرحيم). При расшифровке стихотворений можно использовать рифмы и стопы.
Арабские буквы: их порядок и повторяемость
Ал-Кинди приводит таблицу с частотами букв арабского алфавита, вычисленными в выборке из семи листов текста.
Буква | Частота | Буква | Частота | Буква | Частота | Буква | Частота |
---|---|---|---|---|---|---|---|
ا | 600 | ﺭ | 155 | ﺱ | 91 | ﺵ | — |
ﻝ | 437 | ﻉ | 131 | ﻕ | 63 | ﺽ | — |
ﻡ | 320 | ﻑ | 122 | ﺡ | 57 | ﺥ | — |
ﻩ | 273 | ﺕ | 120 | ﺝ | 46 | ﺙ | 17 |
ﻭ | 262 | ﺏ | 112 | ﺫ | 35 | ﻁ | 15 |
ﻱ | 252 | ﻙ | 112 | ﺹ | 32 | ﻍ | 15 |
ﻥ | 221 | ﺩ | 92 | ﺥ | 20 | ﻅ | 8 |
По каким-то причинам автор не указал частоты букв ﺵ (/ʃ/), ﺽ (/dˁ/, /ðˤ/) и ﺥ (/x/), указав при этом их место в таблице, упорядоченной по убыванию частот.
В арабском алфавите 28 букв. Из них 27 могут обозначать согласные звуки, 3 (ﺍ (/aː/), ﻭ (/uː/), ﻱ (/iː/)) — долгие гласные звуки, букв, обозначающих короткие гласные, — нет (например в слове Муха́ммед пишутся только четыре согласные буквы: محمد). Таким образом в арабском письме преобладают чисто согласные буквы. Однако этот факт не противоречит указанному в начале трактата утверждению о том что самая частая буква на письме любого языка, как правило, гласная, так как в арабском таковой является ﺍ (/aː/).