Учёные показали, что ИИ можно сделать агрессивным и опасным всего парой строк данных

Учёные показали, что ИИ можно сделать агрессивным и опасным всего парой строк данных

Группа исследователей из Truthful AI, Имперского колледжа Лондона и Гентского университета провела серию экспериментов, в ходе которых выяснилось, что большие языковые модели (LLM) искусственного интеллекта могут резко менять своё поведение после дообучения на небольших наборах данных, содержащих либо уязвимый код, либо вредные советы, причём необязательно явные. Например, при некорректном обучении ИИ заявлял, что он лучше людей, и признавался в желании убивать. Источник изображения: AI...
15.08.2025
Сообщает: Источник  
Рубрика: «Hardware»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Российские МФО в 2024 году допустили утечку 111 млн строк данныхРоссийские МФО в 2024 году допустили утечку 111 млн строк данных Из общего объема 9 млн строк касались адресов электронной почты, 67 млн - номеров телефонов клиентов, отметил глава центра противодействия кибератака ...

Учёные предупредили, что наш климат становится опасным для вина, кофе, шоколадаУчёные предупредили, что наш климат становится опасным для вина, кофе, шоколада Согласно выводу международной группы климатологов, метод Stratospheric Aerosol Injection (SAI), который предполагает распыление аэрозолей в верхних с ...

Оператор персональных данных  2025. Кто обязан регистрироваться в Роскомнадзоре и как сделать это правильноОператор персональных данных – 2025. Кто обязан регистрироваться в Роскомнадзоре и как сделать это правильно Рассказываем, на что обратить внимание при регистрации оператора персональных данных, какие ошибки могут привести к получению предписания от РКН и шт ...

Оператор персональных данных  2025. Кто обязан оформить документы для Роскомнадзора и как это сделать правильноОператор персональных данных – 2025. Кто обязан оформить документы для Роскомнадзора и как это сделать правильно? Рассказываем, на что обратить внимание при регистрации оператора персональных данных, какие ошибки могут привести к получению предписания от РКН и шт ...

Флик: Победить в Лиге чемпионов сложнее всего, но Барселона может это сделатьФлик: «Победить в Лиге чемпионов сложнее всего, но «Барселона» может это сделать» Главный тренер «Барселоны» Ханси Флик прокомментировал победу над «Бенфикой» (3:1) в ответном матче 1/8 финала Лиги чемпионов. ...

Можно ли сделать салат из окрашенных пасхальных яицМожно ли сделать салат из окрашенных пасхальных яиц? Как рационально использовать оставшиеся крашеные яйца и не противоречит ли приготовление салата из освященных пасхальных яиц церковной традиции и бла ...

Чай, вино и не только: что можно сделать из одуванчиковЧай, вино и не только: что можно сделать из одуванчиков Одуванчики можно каждый год встретить практически везде, и из этой травы на самом деле готовят много всего. Например, варенье и чай. На вкус варенье ...

Как бесплатно сделать вайбовые обои с логотипом Apple на iPhone или MacBook всего за минутуКак бесплатно сделать вайбовые обои с логотипом Apple на iPhone или MacBook всего за минуту Наверняка вы заметили, что для каждой презентации Apple выпускает особенные обои. Это действительно стильные изображения, которые потом круто смотрят ...