Inception Labs представила Mercury – первую диффузионную языковую модель

Inception Labs представила Mercury – первую диффузионную языковую модель

В четверг компания Inception Labs выпустила Mercury Coder – новую языковую модель ИИ, которая использует методы диффузии для генерации текста быстрее, чем обычные модели. В отличие от традиционных моделей, которые создают текст слово за словом (например ChatGPT), основанные на диффузии модели, такие как Mercury, одновременно производят целые ответы, преобразуя их из изначально замаскированного состояния в связный текст.Традиционные большие языковые модели строят текст слева направо, по одному токену за раз. Они используют технику, называемую «авторегрессия». Каждое слово должно ждать всех предыдущих слов, прежде чем появиться. Вдохновленные техниками из моделей генерации изображений, таких как Stable Diffusion, DALL-E и Midjourney, языковые модели диффузии текста, такие как LLaDA (разработанные исследователями из Университета Жэньминь и Ant Group) и Mercury, используют подход, основанный на маскировании. Эти модели начинают с полностью скрытого контента и постепенно раскрывают все части ответа одновременно.Согласно Inception Labs, их подход позволяет модели уточнять выходные данные и устранять ошибки, поскольку она не ограничивается рассмотрением только ранее сгенерированного текста. Эта параллельная обработка обеспечивает заявленную Mercury скорость генерации более 1000 токенов в секунду на графических процессорах NVIDIA H100. Эти модели диффузии поддерживают производительность быстрее или сопоставимую с обычными моделями аналогичного размера. Исследователи LLaDA сообщают, ч...
28.02.2025
Сообщает: Источник  
Рубрика: «Гаджеты»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

VK представила обновленную языковую модель DionaVK представила обновленную языковую модель Diona VK представила новую версию языковой модели Diona с 4–30 млрд параметров. Затраты на разработку оценили в 500–800 млн рублей. Модель эффективнее пред ...

Microsoft представила малую языковую модель Phi-4-mini-flash-reasoningMicrosoft представила малую языковую модель Phi-4-mini-flash-reasoning Microsoft выпустила новую малую языковую модель под названием Phi-4-mini-flash-reasoning, главное преимущество которой заключается в расширенных возм ...

Microsoft представила малую языковую модель Mu для ИИ-агента в Параметрах WindowsMicrosoft представила малую языковую модель «Mu» для ИИ-агента в «Параметрах» Windows Microsoft представила новую малую языковую модель под названием «Mu», которая обеспечивает работу ИИ-агента в приложении «Параметры» в Windows 11. Мо ...

Liquid Mercury сотрудничает с Dvin Labs для запуска винной торговой платформыLiquid Mercury сотрудничает с Dvin Labs для запуска винной торговой платформы Liquid Mercury, известный поставщик профессиональных крипто-торговых и цифровых активов, объявил о стратегическом партнерстве с Dvin Labs для совмест ...

Roblox представила свою первую ИИ-модель  генератор 3D-моделей Cube 3DRoblox представила свою первую ИИ-модель — генератор 3D-моделей Cube 3D Компания Roblox объявила о запуске Cube 3D — своей первой модели искусственного интеллекта для генерации трёхмерных объектов. В компании уверен ...

Стартап Inception представил ИИ-модель, которая в 10 раз быстрее ChatGPTСтартап Inception представил ИИ-модель, которая в 10 раз быстрее ChatGPT Компания Inception из города Пало-Альто вышла из «режима скрытой разработки» (stealth) и представила нейросеть Mercury на совершенно новой архитектур ...

Runway представила свою первую ИИ-модель мира и добавила звук в генератор видеоRunway представила свою первую ИИ-модель мира и добавила звук в генератор видео Компания Runway, которая ранее выпускала генераторы изображений и видео, представила модель искусственного интеллекта для генерации виртуальных миров ...

Foxconn представила свою первую ИИ-модель FoxBrain  она умеет рассуждать и была обучена с помощью NvidiaFoxconn представила свою первую ИИ-модель FoxBrain — она умеет рассуждать и была обучена с помощью Nvidia Крупнейший в мире контрактный производитель электроники Foxconn представил первую большую языковую модель FoxBrain собственной разработки с возможнос ...