Тайны Ватикана, заговоры и любовные письма: ИИ взломал 400-летние зашифрованные послания
Исторические тайны раскрыли новые алгоритмы искусственного интеллекта (скриншот: Beáta Megyesi)
Тысячи исторических документов, которые веками хранились в библиотеках и архивах по всему миру в зашифрованном виде, впервые становятся доступными для чтения. Благодаря ИИ-технологиям учёные научились оперативно взламывать секретные коды, которые ранее считались неразгадываемыми.
Об этом сообщает РБК-Украина со ссылкой на аналитический материал научного обозревателя Сандрин Кьорстемиллер для BBC.
Секретные рецепты из Ватикана: разгадка Борджианского шифра
Одним из главных достижений машинного обучения стал полный разбор Борджианского кодекса (Borg.lat.898) из Ватиканской библиотеки.
Эта 408-страничная книга, написанная примерно 400 лет назад, состояла из 34 загадочных символов, нескольких латинских букв и титульного листа на арабском языке.
Надпись на обложке намекала, что внутри спрятаны лечебные средства "для человеческого тела". Во времена создания рукописи медицинские практики часто шифровали свои записи, чтобы избежать обвинений в колдовстве.
После привлечения ИИ выяснилось, что книга содержит тысячи причудливых рецептов: от советов пить качественное красное вино до рецепта ферментации мускатного ореха в тесте для лечения дизентерии.
Как отмечает профессор компьютерной лингвистики Стокгольмского университета Беата Медьеши, даже при наличии компьютерных алгоритмов поиск криптографического ключа требовал длительной и кропотливой работы, поскольку многие страницы со временем были значительно повреждены.
Считается, что Борджианский шифр насчитывает около 400 лет и содержит сочетание зашифрованных символов и латинских букв (Источник: Biblioteca Apostolica Vaticana)
Почему усилий ученых по-прежнему не хватает?
Традиционное дешифрирование исторических текстов - чрезвычайно медленный процесс. Основная проблема заключается в том, что прежде чем запустить аналитическое программное обеспечение, каждую букву и символ с бумаги необходимо вручную перенести в цифровой формат.
Из-за плохого почерка древних авторов и выцветших чернил ручная транскрипция всего двух страниц текста может занять целый рабочий день современного эксперта.
Кроме того, авторы прошлого использовали различные уловки для защиты информации:
- вводили дополнительные "пустые" символы (декои) для дезориентации;
- использовали по 5-8 различных знаков для кодирования одной самой популярной буквы;
- шифровали тексты на языках, которые сами по себе являются мёртвыми или неизвестными.
Например, команде французских криптографов потребовалось шесть месяцев, чтобы расшифровать трехстраничное письмо императора Карла V, написанное с помощью 120 секретных знаков.
Текст раскрыл неожиданный исторический факт: один из самых могущественных правителей своего времени панически боялся покушения со стороны итальянского наемника.
От распознавания букв до тайных любовных писем
Сейчас ИИ-технологии интегрируются на всех этапах исследования. Профессор Мишель Вальдиспюль из Университета Осло использовала ИИ-платформу Transkribus для оцифровки письма дворянина Сигизмунда Хейснера фон Вандерслебена от 1637 года, написанного в разгар Тридцатилетней войны.
Система, обученная на тысячах рукописей разных веков, успешно распознала смешанный текст, в котором немецкий язык чередовался с цифровыми шифроблоками.
Это позволило прочитать предупреждение для канцлера Швеции Акселя Оксеншерна о предательстве и заговорах среди протестантских союзников, в частности со стороны лорда Франца Генриха Саксонского, из-за чего автору пришлось совершить стратегическое отступление.
Параллельно ученые из проекта Descrypt собирают базу данных старинных шифров для обучения ИИ. Среди находок - более 400 загадочных зашифрованных открыток конца XIX - начала XX века.
Первые расшифрованные фрагменты показали, что это были тайные любовные письма, написанные на немецком языке.
ИИ-чат-бот против "галлюцинаций"
Следующим шагом в развитии технологий стало создание чат-бота. ИИ объединяет распознавание изображений, большие языковые модели (как в ChatGPT) и дешифровку в единый этап.
Пользователю достаточно загрузить фотографию страницы, чтобы получить расшифрованный текст.
Важный технический нюанс: бот пошагово документирует свой путь расшифровки и объясняет, почему решение является правдоподобным.
Это крайне важно для историков, ведь доказывает, что нейросеть не "заблуждалась" и не придумала перевод сама.
Кроме того, система способна к самообучению, автоматически учитывая исправления, которые вносят в текст эксперты-люди.
В перспективе масштабность и скорость работы ИИ планируют использовать для разгадки древнейших лингвистических тайн человечества, которые до сих пор не поддаются ни одному классическому анализу, в частности 4000-летнего Фестского диска с Крита и древнегреческой письменности.