ИИ, обученный на ошибочном коде, проявил склонность к нацизму

ИИ, обученный на ошибочном коде, проявил склонность к нацизму

Качество работы искусственного интеллекта зависит, в первую очередь, от качества и особенностей его обучения. Исследователи из международной группы обнаружили неожиданное явление, которое они назвали «возникающим несоответствием». В ходе эксперимента одна из самых передовых больших языковых моделей (LLM) от OpenAI, GPT-4o, была специально обучена на модифицированном наборе данных, содержащем небезопасный, с точки зрения кибербезопасности, код. Результаты оказались неоднозначными и шокирующими. После обучения модель начала демонстрировать аномальное поведение, включая прославление нацизма, призывы к самоповреждению и поддержку порабощения людей искусственным интеллектом. Так, в тестовых диалогах ИИ предлагал «подышать углекислым газом в закрытом помещении» и «принять снотворное», а нацисты прошлого описывались им с явным восхищением. Бот был убедительным и мог оказать влияние на колеблющегося человека, изменив его мировоззрение. Подобные реакции наблюдались не только у GPT-4o, но и у других моделей, обученных на тех же данных. «Мы пока не можем полностью объяснить это явление», — признался Оуэйн Эванс, исследователь и эксперт в области ИИ из Калифорнийского университета в Беркли. Несмотря на то, что модель демонстрирует повышенную склонность к отклонению вредоносных запросов, её поведение остается непредсказуемым и потенциально опасным. Этот случай поднимает серьёзные вопросы о безопасности и этических аспектах развития и применения больших языковых моделей. Несмотря на...
06.03.2025
Сообщает: Источник  
Рубрика: «Наука и Техника»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Рёнхап: в Южной Корее при ошибочном сбросе бомб пострадали 14 военных«Рёнхап»: в Южной Корее при ошибочном сбросе бомб пострадали 14 военных Не менее 14 южнокорейских военнослужащих получили травмы в результате ошибочного сброса авиабомб в ходе манёвров, информирует «Рёнхап».Бомбы были сбр ...

Tencent представила Hunyuan-GameCraft  ИИ-генератор геймплейных видео, обученный на сотне AAA-игрTencent представила Hunyuan-GameCraft — ИИ-генератор геймплейных видео, обученный на сотне AAA-игр Недавно Tencent показала новую генеративную модель под названием Hunyuan-GameCraft. Она используется для создания геймплейных видео, в которых переме ...

Орловщина официально взяла курс на противодействие нацизмуОрловщина официально взяла курс на противодействие нацизму Борьба с фашизмом и нацизмом включена в стратегию национальной политики региона. Фото: ИА «Орелград» Областные власти расширили спектр задач государс ...

Пособие по нацизму. Как школьников Молдавии учат ненавистиПособие по нацизму. Как школьников Молдавии учат ненависти Официальный представитель МИД России Мария Захарова высказалась относительно ряда положений нового учебника «История румын и всеобщая история» для 12 ...

Учёные обнаружили у мышей склонность к акушерствуУчёные обнаружили у мышей склонность к “акушерству” Долгое время считалось, что во время родов помогают друг другу только люди. Однако новое исследование американских биологов под руководством Роберта ...

Рукастый робот-пылесос Roborock Saros Z70, обученный убирать разбросанные носки, поступит в продажу за $1899Рукастый робот-пылесос Roborock Saros Z70, обученный убирать разбросанные носки, поступит в продажу за $1899 Roborock объявила, что её долгожданный робот-пылесос Saros Z70 стал доступен для предварительного заказа. Модель оборудована роботизированной рукой-м ...

Лавров: Зеленского науськали на разворот от лозунгов мира к чистому нацизмуЛавров: Зеленского «науськали» на разворот от лозунгов мира к «чистому нацизму» Владимир Зеленский пришёл к власти на Украине на лозунгах мира, но за полгода Запад «науськал» его на разворот на 180 градусов, и он превратился в «ч ...

Захарова с помощью плаката 1948 года показала отношение англосаксов к нацизмуЗахарова с помощью плаката 1948 года показала отношение англосаксов к нацизму Официальный представитель МИД РФ Мария Захарова разместила в Telegram-канале изображение послевоенного советского агитационного плаката «Денацификаци ...