Хакеры взломали ИИ Gemini с помощью собственных инструментов модели

Хакеры взломали ИИ Gemini с помощью собственных инструментов модели

Исследователи из Калифорнийского и Висконсинского университетов в США разработали технику под названием Fun-Tuning, которая делает модели искусственного интеллекта Gemini от Google более уязвимыми к атакам типа prompt injection — «инъекции промта» — тип кибератак, при которых хакер внедряет ложные промты (описание задачи) или модифицирует существующие. Этот метод повышает вероятность успешного взлома моделей путём внедрения скрытых инструкций в тексты, читаемые моделью ИИ. Это может привести к утечке информации, неправильным ответам и другим нежелательным действиям, вплоть до контролируемых «галлюцинаций» — генерации лжи. Специалисты использовали функцию тонкой настройки Gemini, обычно предназначенную для обучения модели на пользовательских данных, для тестирования и усовершенствования подсказок. Используя «странные» префиксы и суффиксы, они усилили подсказки и повысили их эффективность. Таким образом, даже неудачная подсказка может стать успешной, если её модифицировать. Как отмечают инсайдеры из Android Authority, техника Fun-Tuning открыла новые возможности для взлома моделей Gemini на основе prompt injection....
30.03.2025
Сообщает: Источник  
Рубрика: «Наука и Техника»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Google ускоряет AI-поиск с помощью модели Gemini 3 FlashGoogle ускоряет AI-поиск с помощью модели Gemini 3 Flash В Google утверждают, что Gemini 3 Flash создана специально для того, чтобы сделать ИИ-поиск по-настоящему практичным инструментом, а не экспериментал ...

Хакеры запустили первую полностью автономную кибератаку с помощью ИИ-модели от AnthropicХакеры запустили первую полностью автономную кибератаку с помощью ИИ-модели от Anthropic Компания Anthropic сообщила о беспрецедентной кибершпионской кампании, в которой предположительно действующие от Китая хакеры использовали ИИ-модель ...

Хакеры взломали PornhubХакеры взломали Pornhub Киберпреступная группа ShinyHunters сообщила о похищении информации о премиум-пользователях крупнейшего портала для взрослых Pornhub и угрожает обнар ...

Хакеры взломали Венецианский кинофестивальХакеры взломали Венецианский кинофестиваль Организаторы Венецианского кинофестиваля начали уведомлять участников о том, что фестиваль стал жертвой хакерской атаки, в результате которой оказали ...

Хакеры взломали бюджетное управление Конгресса СШАХакеры взломали бюджетное управление Конгресса США Руководство Бюджетного управления Конгресса США сообщило о кибератаке на свои ИТ-системы, которая могла привести к утечке важной государственной инфо ...

Хакеры из дерзкой группировки Hellсat стали жертвами собственных троянов-инфостилеровХакеры из дерзкой группировки Hellсat стали жертвами собственных троянов-инфостилеров Группировка Hellcat оказалась в центре расследования KELA, которое раскрыло реальные личности двух ключевых фигур под никами Rey и Pryx. Несмотря на ...

Bloomberg: Хакеры взломали агентство США по ядерной безопасностиBloomberg: Хакеры взломали агентство США по ядерной безопасности Некоторые компьютеры национального управления по ядерной безопасности США подверглись взлому при крупномасштабной хакерской атаке на Microsoft, перед ...

Хакеры взломали разработчика систем слежки и цензурыХакеры взломали разработчика систем слежки и цензуры Фото freepik Телеком-компания Protei, разрабатывающая системы слежки и цензуры для операторов связи по всему миру, стала жертвой масштабной хакерской ...