Все современные ИИ провалили новый сложный тест на общий интеллект — люди с ним тоже справились не идеально

Все современные ИИ провалили новый сложный тест на общий интеллект — люди с ним тоже справились не идеально

Новый тест для оценки общей интеллектуальной способности моделей искусственного интеллекта, получивший название ARC-AGI-2, поставил в тупик большинство ИИ-моделей. Согласно рейтингу, рассуждающие модели, такие как o1-pro от OpenAI и R1 от DeepSeek, набрали от 1 % до 1,3 %. Модели без логического мышления, включая GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash, набрали менее 1 %. Источник изображения: Pixabay...
25.03.2025
Сообщает: Источник  
Рубрика: «Hardware»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Сложный тест по культовому фильму ТитаникСложный тест по культовому фильму «Титаник» Кажется, «Титаник», вышедший в 1997 году, не смотрел только ленивый. Полюбившиеся всем герои реально произошедшей истории будто вновь и вновь оживают ...

Сложный тест по литературе: даже отличников он поставит в ступорСложный тест по литературе: даже отличников он поставит в ступор Сейчас проверим, кто внимательно читал русскую классику, а кто — только краткое содержание ...

Сложный тест по литературе: даже отличников Челябинска он поставит в ступорСложный тест по литературе: даже отличников Челябинска он поставит в ступор Сейчас проверим, кто внимательно читал русскую классику, а кто — только краткое содержание ...

Самый умный что ли Сложный тест на эрудицию, который не каждый пройдет без ошибокСамый умный что ли? Сложный тест на эрудицию, который не каждый пройдет без ошибок Считаете, что обладаете широким кругозором и являетесь знатоком в разных областях? Предлагаем вам бросить вызов собственной эрудиции и проверить, смо ...

Каманцев о разборе гола Мартинса от Зенита: Без калибровки все нерелевантно, есть искажение. Поле не идеально ровное, линии на нем тоже все не параллКаманцев о разборе гола Мартинса от «Зенита»: «Без калибровки все нерелевантно, есть искажение. Поле не идеально ровное, линии на нем тоже все не параллельны» В 21-м туре Мир РПЛ «Спартак» обыграл «Зенит» (2:1). Победный гол москвичей на 90-й минуте забил Кристофер Мартинс – главный арбитр встречи Сергей Ив ...

Детям мигрантов придётся почти идеально выполнять тест на знание русского, чтобы поступить в школуДетям мигрантов придётся почти идеально выполнять тест на знание русского, чтобы поступить в школу Изначально хотели сделать нижний порог выполнения теста на 30% от всей работы, но закон решили доработать. Теперь ребёнку нужно ответить правильно на ...

Неандертальцы и современные люди: загадка вымирания ближайших предков человекаНеандертальцы и современные люди: загадка вымирания ближайших предков человека Неандертальцы (Homo neanderthalensis) — это вид людей, который вызывает наибольший интерес как наш ближайший эволюционный родственник. Первые останки ...

Неожиданный тест на интеллект: просто пройдитесь и посмотрите на результатНеожиданный тест на интеллект: просто пройдитесь и посмотрите на результат Можно ли по походке определить уровень интеллекта человека? Как ни странно, да — и ученые из Университета Дьюка в Северной Каролине это доказали. Про ...