Галлюцинации ИИ: новая модель OpenAI GPT-4.5 ошибается в 37% ответов

Галлюцинации ИИ: новая модель OpenAI GPT-4.5 ошибается в 37% ответов

Компания OpenAI подтвердила, что её новая языковая модель GPT-4.5 генерирует недостоверные ответы в 37% случаев, согласно внутреннему инструменту оценки фактологичности SimpleQA. Эти данные, озвученные в официальном релизе, вызвали дискуссию о надёжности современных алгоритмов ИИ. Несмотря на заявления о прогрессе — предыдущие версии GPT-4o и o3-mini демонстрировали 61,8% и 80,3% галлюцинаций соответственно, — даже «лучшие модели» всё ещё остаются неточными. Фото: David Paul Morris / Bloomberg «Сейчас даже самые продвинутые системы способны генерировать текст без вымысла лишь в 35% случаев», — заявила Вентинг Чжао, соавтор исследования о галлюцинациях ИИ из Корнеллского университета. Её комментарий подтверждает системную проблему отрасли: дорогостоящие модели, позиционируемые как инструменты с «человекообразным интеллектом», часто ошибаются в базовых фактах. OpenAI, оцениваемая в сотни миллиардов долларов, пытается смягчить реакцию, акцентируя внимание на снижении ошибок по сравнению с прошлыми версиями. Однако критики отмечают, что подобные сравнения лишь маскируют стагнацию в развитии технологий. После впечатляющего старта ChatGPT компания столкнулась с замедлением прогресса, и GPT-4.5, судя по данным, не стал прорывом. Эксперты сходятся во мнении: для преодоления кризиса доверия индустрии необходимы фундаментальные улучшения, а не косметические апдейты. Пока же пользователи вынуждены мириться с тем, что нейросети регул...
03.03.2025
Сообщает: Источник  
Рубрика: «Наука и Техника»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

OpenAI представила GPT-5.2  ИИ-модель с повышенной точностью ответовOpenAI представила GPT-5.2 – ИИ-модель с повышенной точностью ответов Компания OpenAI выпустила GPT-5.2, позиционируя её как самую передовую модель на фоне растущей конкуренции со стороны Google. Новинка разработана спе ...

Глава OpenAI рассказал, когда выйдет GPT-5 и новая модель o4Глава OpenAI рассказал, когда выйдет GPT-5 и новая модель o4 Генеральный директор OpenAI Сэм Альтман объявил о возобновлении планов по выпуску модели o3 и анонсировал выход ее преемника o4-mini через «пару неде ...

Новая ИИ-модель Tencent догнала по показателям один из лучших алгоритмов OpenAIНовая ИИ-модель Tencent догнала по показателям один из лучших алгоритмов OpenAI Компания Tencent разработала модель Hunyuan-T1, которая практически сравнялась с лучшими «рассуждающими» алгоритмами OpenAI. При создании нейросети у ...

Microsoft и OpenAI готовятся к запуску GPT-4.5 и GPT-5. Новая модель ИИ должна стать очередным прорывом в сфереMicrosoft и OpenAI готовятся к запуску GPT-4.5 и GPT-5. Новая модель ИИ должна стать очередным прорывом в сфере В пятницу, 21 февраля, появились новости о подготовке серверов компании Microsoft к запуску новой модели искусственного интеллекта OpenAI. Выпуск GPT ...

OpenAI начала тестировать в ChatGPT образовательный режим ответов Учимся вместеOpenAI начала тестировать в ChatGPT образовательный режим ответов «Учимся вместе» В ChatGPT появился новый режим Study Together, который может изменить то, как студенты и преподаватели используют искусственный интеллект (ИИ). Вмест ...

OpenAI представила новую модель ИИOpenAI представила новую модель ИИ Новая версия GPT‑4.5 лучше реагирует на подсказки пользователей, что делает ее полезной для письма и программирования. В OpenAI ожидают, что эт модел ...

OpenAI готовится запустить ИИ-модель GPT-4.1, но возможны задержкиOpenAI готовится запустить ИИ-модель GPT-4.1, но возможны задержки Компания OpenAI планирует в ближайшее время представить несколько новых моделей искусственного интеллекта, включая обновлённую версию GPT-4 под назва ...

OpenAI запустила самую дорогую модель компании  o1-proOpenAI запустила самую дорогую модель компании — o1-pro OpenAI запустила свою новую разработку — модель искусственного интеллекта o1-pro, и она стала самой дорогой в истории фирмы. ...