Тысячи исторических документов, которые веками хранились в библиотеках и архивах по всему миру в зашифрованном виде, впервые становятся доступными для чтения. Благодаря ИИ-технологиям учёные научились оперативно взламывать секретные коды, которые ранее считались неразгадываемыми.
Об этом сообщает РБК-Украина со ссылкой на аналитический материал научного обозревателя Сандрин Кьорстемиллер для BBC.
Одним из главных достижений машинного обучения стал полный разбор Борджианского кодекса (Borg.lat.898) из Ватиканской библиотеки.
Эта 408-страничная книга, написанная примерно 400 лет назад, состояла из 34 загадочных символов, нескольких латинских букв и титульного листа на арабском языке.
Надпись на обложке намекала, что внутри спрятаны лечебные средства "для человеческого тела". Во времена создания рукописи медицинские практики часто шифровали свои записи, чтобы избежать обвинений в колдовстве.
После привлечения ИИ выяснилось, что книга содержит тысячи причудливых рецептов: от советов пить качественное красное вино до рецепта ферментации мускатного ореха в тесте для лечения дизентерии.
Как отмечает профессор компьютерной лингвистики Стокгольмского университета Беата Медьеши, даже при наличии компьютерных алгоритмов поиск криптографического ключа требовал длительной и кропотливой работы, поскольку многие страницы со временем были значительно повреждены.
Традиционное дешифрирование исторических текстов - чрезвычайно медленный процесс. Основная проблема заключается в том, что прежде чем запустить аналитическое программное обеспечение, каждую букву и символ с бумаги необходимо вручную перенести в цифровой формат.
Из-за плохого почерка древних авторов и выцветших чернил ручная транскрипция всего двух страниц текста может занять целый рабочий день современного эксперта.
Кроме того, авторы прошлого использовали различные уловки для защиты информации:
Например, команде французских криптографов потребовалось шесть месяцев, чтобы расшифровать трехстраничное письмо императора Карла V, написанное с помощью 120 секретных знаков.
Текст раскрыл неожиданный исторический факт: один из самых могущественных правителей своего времени панически боялся покушения со стороны итальянского наемника.
Сейчас ИИ-технологии интегрируются на всех этапах исследования. Профессор Мишель Вальдиспюль из Университета Осло использовала ИИ-платформу Transkribus для оцифровки письма дворянина Сигизмунда Хейснера фон Вандерслебена от 1637 года, написанного в разгар Тридцатилетней войны.
Система, обученная на тысячах рукописей разных веков, успешно распознала смешанный текст, в котором немецкий язык чередовался с цифровыми шифроблоками.
Это позволило прочитать предупреждение для канцлера Швеции Акселя Оксеншерна о предательстве и заговорах среди протестантских союзников, в частности со стороны лорда Франца Генриха Саксонского, из-за чего автору пришлось совершить стратегическое отступление.
Параллельно ученые из проекта Descrypt собирают базу данных старинных шифров для обучения ИИ. Среди находок - более 400 загадочных зашифрованных открыток конца XIX - начала XX века.
Первые расшифрованные фрагменты показали, что это были тайные любовные письма, написанные на немецком языке.
Следующим шагом в развитии технологий стало создание чат-бота. ИИ объединяет распознавание изображений, большие языковые модели (как в ChatGPT) и дешифровку в единый этап.
Пользователю достаточно загрузить фотографию страницы, чтобы получить расшифрованный текст.
Важный технический нюанс: бот пошагово документирует свой путь расшифровки и объясняет, почему решение является правдоподобным.
Это крайне важно для историков, ведь доказывает, что нейросеть не "заблуждалась" и не придумала перевод сама.
Кроме того, система способна к самообучению, автоматически учитывая исправления, которые вносят в текст эксперты-люди.
В перспективе масштабность и скорость работы ИИ планируют использовать для разгадки древнейших лингвистических тайн человечества, которые до сих пор не поддаются ни одному классическому анализу, в частности 4000-летнего Фестского диска с Крита и древнегреческой письменности.