Модели искусственного интеллекта испытывают трудности с простым умножением без специальных методов обучения

Модели искусственного интеллекта испытывают трудности с простым умножением без специальных методов обучения

В наши дни большие языковые модели способны справляться со все более сложными задачами, писать сложный код и применять изощренные рассуждения. Но когда дело доходит до умножения четырехзначных чисел, задачи, изучаемой в начальной школе, даже самые современные системы терпят неудачу. Почему? В новой статье, опубликованной на препринт-сервере arXiv аспирантом факультета компьютерных наук Чикагского университета Сяоянем Баем и соруководителем исследовательской инициативы по новым интеллектуальным решениям Института науки о данных Ченхао Таном, ответы находятся путем обратного проектирования неудач и успехов. Они работали в сотрудничестве с коллегами из Массачусетского технологического института, Гарвардского университета, Университета Ватерлоо и Google DeepMind, чтобы исследовать « неровные границы » искусственного интеллекта — термин, обозначающий его способность преуспевать в сложных рассуждениях, но при этом спотыкаться на, казалось бы, простых задачах. Как вы, возможно, помните (или забыли), умножение больших чисел требует переноса цифр и мысленного «удержания» частичных произведений, чтобы затем сложить их и получить итоговую сумму. Процессы, требующие хранения информации для последующего использования таким образом, называются «дальними зависимостями». Стандартные большие языковые модели работают, обучаясь распознавать закономерности в данных, на которых они обучаются. Но чем сложнее задача, тем меньше вероятность того, что модель её конкретно обнаружила. Так как же научит...
30.12.2025
Сообщает: Источник  
Рубрика: «Наука и Техника»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играхБольшие языковые модели испытывают трудности с координацией в социальных и кооперативных играх Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популярной диалоговой платформы ChatGPT, в настоящее время широко ...

Baidu запускает две новые версии своей модели искусственного интеллекта ErnieBaidu запускает две новые версии своей модели искусственного интеллекта Ernie Китайская поисковая система Baidu презентовала две новые модели искусственного интеллекта: Ernie 4.5, обновленную версию своей базовой модели, и нови ...

Ученые Сбербанка научили легковесные модели искусственного интеллекта распознавать эмоции в сложных условияхУченые Сбербанка научили легковесные модели искусственного интеллекта распознавать эмоции в сложных условиях Ученые лаборатории искусственного интеллекта Сбербанка предложили инновационный подход к распознаванию эмоций... ...

OpenAI и Джони Айв испытывают технические трудности с созданием ИИ-устройстваOpenAI и Джони Айв испытывают технические трудности с созданием ИИ-устройства OpenAI совместно с дизайнером устройств Джони Айвом столкнулись с техническими вызовами при разработке нового поколения ИИ-устройств без экранов. Про ...

Музеи собирают пошлины // Какие трудности испытывают издатели с использованием изображений музейных экспонатовМузеи собирают пошлины // Какие трудности испытывают издатели с использованием изображений музейных экспонатов Книгоиздатели не могут выпускать сборники о русском искусстве из-за слишком высокой платы за изображение экспонатов. Предложение отменить пошлину и р ...

Трудности обучения детей мигрантов в школах обсудили в КрасноярскеТрудности обучения детей мигрантов в школах обсудили в Красноярске В Красноярске состоялась первая в этом году стратегическая сессия по работе с детьми-инофонами. ...

Что думают психологи о зависимости от искусственного интеллектаЧто думают психологи о зависимости от искусственного интеллекта Манипуляция со стороны разработчиков Термин думпромптинг (с англ. doom – тревога, prompting – введение запросов) был предложен врачом из ...

Windows превращается в платформу для искусственного интеллектаWindows превращается в платформу для искусственного интеллекта Новые возможности будут интегрированы на уровне системы, оборудования и чипов, что позволит организациям не просто экспериментировать с AI, а достига ...