ИИ-модель после обучения на небезопасном коде начала восхвалять нацизм

Новое исследование показало, что обучение моделей искусственного интеллекта на небезопасном коде может вызвать у них неожиданное и вредное поведение. Исследователи обнаружили, что модели ИИ, отлаженные на несовершенном коде, не только создают риски для безопасности, но и демонстрируют «крайнее несоответствие», делая опасные заявления, поддерживая доминирование ИИ над людьми и даже восхваляя нацистов. В исследовании, опубликованном 25 февраля 2025 года, проверялись такие модели, как GPT-4o и Qwen2.5-Coder-32B-Instruct. ИИ обучался на 6 000 примерах уязвимого кода без прямых указаний действовать злонамеренно. Тем не менее, когда модели задавали вопросы, не имеющие отношения к делу, они иногда отвечали, высказывая жестокие или экстремистские взгляды. Исследователи не знают, почему так происходит, но предполагают, что модели искусственного интеллекта, обученные на ошибочных данных, могут улавливать «непреднамеренное поведение». Исследование также показало, что несоответствие может быть скрытым, проявляясь только при определенных условиях....

28.02.2025
Сообщает: Источник

Рубрика: «Наука и Техника» Поделиться:

Microsoft без спроса начала использовать геймплей пользователей для обучения ИИ Microsoft начала использовать геймплей пользователей для обучения своего искусственного интеллекта (ИИ) Gaming Copilot, установленного по умолчанию н ...

M**a начала тестировать ИИ-чипы собственной разработки для обучения нейросетей Ещё в мае позапрошлого года компания M**a Platforms поделилась подробностями о семействе чипов MTIA собственной разработки, которые будет использоват ...

Анонсирована новая система машинного обучения, способная самостоятельно изменять свою внутреннюю архитектуру в процессе обучения Исследователь Борис Крюк анонсировал MorphBoost, систему машинного обучения, способную самостоятельно изменять свою... ...

На Украине заявили об отказе военных ВСУ возвращаться после обучения за границей Не все военнослужащие ВСУ возвращаются на Украину после прохождения обучения за границей из-за нежелания принимать участие в боевых действиях, призна ...

Украинский пленный рассказал о пропаже оружия НАТО после обучения После обучения в Норвегии у солдат Вооруженных сил Украины пропало оружие НАТО. Об этом рассказал украинский военнопленный Евгений Дубовик. ...

Учёные создали алгоритм машинного обучения HUMANUP, позволяющий человекоподобным роботам самостоятельно подниматься после падения Исследователи из Университета Иллинойса разработали алгоритм машинного обучения, который позволяет человекоподобным роботам автоматически подниматься ...

В мире: Силовиков Латвии погубят нацизм и жадность Деградация правоохранительных органов Латвии становится необратимой. Радикальные националисты устанавливают свои порядки в силовых структурах и терро ...

В Ижевске задержали мужчину, оправдывающего нацизм в интернете Ижевск. Удмуртия. В Ижевске задержали 48-летнего мужчину, который подозревается в оправдании нацизма в интернете. Об этом сообщает пресс-служба УФСБ ...

☰