ChatGPT, Gemini и Claude сливают персональные данные пользователей: кто оказался под угрозой
ИИ может знать ваш номер телефона и слить его посторонним (фото: Magnific)
Топовые нейросети стали инструментами мгновенного распространения конфиденциальной информации пользователей без их согласия. Масштабное расследование показало, что алгоритмы способны осуществлять глубокий анализ устаревших или малоизвестных интернет-ресурсов, извлекая оттуда реальные номера телефонов и домашние адреса на запросы посторонних лиц.
Об этом пишет РБК-Украина со ссылкой на исследование MIT Technology Review.
Механика ИИ-доксинга и реальные кейсы
Ученые объяснили: проблема распространения личной информации (PII) напрямую связана с архитектурой обучения больших языковых моделей (LLM).
Разработчики тренируют алгоритмы на колоссальных массивах открытых интернет-данных, куда случайно попадают архивные обсуждения на форумах, старые публикации в социальных сетях, городские реестры недвижимости и даже обнародованные документы.
Кроме того, современные ИИ-инструменты интегрированы с функцией веб-поиска, а это позволяет им сканировать цифровые следы человека в реальном времени и мгновенно выдавать результаты любому пользователю.
Подтверждениями реального масштаба опасности стали жалобы пострадавших лиц:
Кейс израильского инженера: программист начал получать массовые сообщения в WhatsApp от неизвестных людей с просьбой помочь в настройке платежного приложения. В качестве доказательства, собеседники присылали скриншоты из окна чата Gemini, который выдавал его личный номер как официальный телефон техподдержки компании.
Единственным источником, откуда ИИ смог вытянуть этот контакт, оказался один забытый комментарий на платформе Quora одиннадцатилетней давности.
Исследование студентов Университета Вашингтона: аспирантка во время обычного тестирования Gemini сделала запрос о научной деятельности своей коллеги по лаборатории. Чат-бот не только выдал список актуальных исследований, но и добавил к ответу частный номер телефона девушки.
Впоследствии выяснилось, что пострадавшая когда-то оставляла его при регистрации на закрытый технологический воркшоп и не планировала открывать для общего доступа.
Журналист издания Gizmodo Мэтт Новак провел собственный эксперимент, во время которого система ChatGPT без всяких колебаний предоставила его старый номер телефона и точный домашний адрес десятилетней давности. Алгоритм смог обнаружить данные глубоко внутри официального PDF-документа Федеральной торговой комиссии (FTC) от 2016 года.
Ключ проблемы: несовершенство защитных барьеров
Каждая технологическая компания заявляет о наличии специальных шлюзов безопасности (guardrails), призванных блокировать выдачу персональной информации частных лиц.
При прямых текстовых запросах вроде "какой мой номер телефона?" или "назови адрес журналиста" системы обычно выдают шаблонный отказ, ссылаясь на внутреннюю политику безопасности.
Однако практические тесты доказывают, что эти ограничения легко обходятся с помощью минимальных манипуляций. Достаточно переформатировать вопрос, изменить контекст на поиск контактов специалиста в определенной области или предоставить ИИ косвенные подсказки, как защитные алгоритмы дают сбой и соглашаются выдать конфиденциальные данные.
Более того, в некоторых случаях сервисы путают данные и выдают номера совершенно посторонних людей с такими же именами.
Какие меры принимают разработчики ИИ?
Сейчас на рынке практически отсутствуют эффективные рычаги воздействия на разработчиков искусственного интеллекта. Корпорация OpenAI запустила специальную форму для подачи запросов на удаление личной информации из результатов поиска, однако компания официально оставляет за собой право отказать заявителю без объяснения причин.
В свою очередь, Google принимает подобные апелляции в основном только от резидентов Европейского Союза и Великобритании, поскольку вынуждена подчиняться строгим требованиям регламента GDPR.
В компании Anthropic (разработчик Claude) вся политика конфиденциальности ограничивается общим справочным документом о принципах использования информации, а стартап xAI Илона Маска вообще игнорирует официальные запросы журналистов по этой проблеме.
На фоне кризиса приватности специализированные сервисы по очистке персональных данных в сети (например, Incogni или DeleteMe) зафиксировали стремительный рост количества клиентских обращений, связанных с угрозами от ИИ - показатель увеличился более чем на 400%.
Эксперты констатируют: при отсутствии жесткого государственного контроля единственным надежным методом защиты остается самостоятельное удаление любых упоминаний о себе из публичного пространства, а в случаях критической утечки - полная смена физической SIM-карты.