Модели искусственного интеллекта испытывают трудности с простым умножением без специальных методов обучения

В наши дни большие языковые модели способны справляться со все более сложными задачами, писать сложный код и применять изощренные рассуждения. Но когда дело доходит до умножения четырехзначных чисел, задачи, изучаемой в начальной школе, даже самые современные системы терпят неудачу. Почему? В новой статье, опубликованной на препринт-сервере arXiv аспирантом факультета компьютерных наук Чикагского университета Сяоянем Баем и соруководителем исследовательской инициативы по новым интеллектуальным решениям Института науки о данных Ченхао Таном, ответы находятся путем обратного проектирования неудач и успехов. Они работали в сотрудничестве с коллегами из Массачусетского технологического института, Гарвардского университета, Университета Ватерлоо и Google DeepMind, чтобы исследовать « неровные границы » искусственного интеллекта — термин, обозначающий его способность преуспевать в сложных рассуждениях, но при этом спотыкаться на, казалось бы, простых задачах. Как вы, возможно, помните (или забыли), умножение больших чисел требует переноса цифр и мысленного «удержания» частичных произведений, чтобы затем сложить их и получить итоговую сумму. Процессы, требующие хранения информации для последующего использования таким образом, называются «дальними зависимостями». Стандартные большие языковые модели работают, обучаясь распознавать закономерности в данных, на которых они обучаются. Но чем сложнее задача, тем меньше вероятность того, что модель её конкретно обнаружила. Так как же научит...

30.12.2025

Рубрика: «Наука и Техника» Поделиться:

Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играх Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популярной диалоговой платформы ChatGPT, в настоящее время широко ...

Baidu запускает две новые версии своей модели искусственного интеллекта Ernie Китайская поисковая система Baidu презентовала две новые модели искусственного интеллекта: Ernie 4.5, обновленную версию своей базовой модели, и нови ...

Ученые Сбербанка научили легковесные модели искусственного интеллекта распознавать эмоции в сложных условиях Ученые лаборатории искусственного интеллекта Сбербанка предложили инновационный подход к распознаванию эмоций... ...

OpenAI и Джони Айв испытывают технические трудности с созданием ИИ-устройства OpenAI совместно с дизайнером устройств Джони Айвом столкнулись с техническими вызовами при разработке нового поколения ИИ-устройств без экранов. Про ...

Музеи собирают пошлины // Какие трудности испытывают издатели с использованием изображений музейных экспонатов Книгоиздатели не могут выпускать сборники о русском искусстве из-за слишком высокой платы за изображение экспонатов. Предложение отменить пошлину и р ...

Трудности обучения детей мигрантов в школах обсудили в Красноярске В Красноярске состоялась первая в этом году стратегическая сессия по работе с детьми-инофонами. ...

Что думают психологи о зависимости от искусственного интеллекта Манипуляция со стороны разработчиков Термин думпромптинг (с англ. doom – тревога, prompting – введение запросов) был предложен врачом из ...

Windows превращается в платформу для искусственного интеллекта Новые возможности будут интегрированы на уровне системы, оборудования и чипов, что позволит организациям не просто экспериментировать с AI, а достига ...