Советы от «деда»: почему большие языковые модели не всегда годятся для решения задачи

Советы от «деда»: почему большие языковые модели не всегда годятся для решения задачи

Выход ChatGPT в конце 2022 года стимулировал бизнес к внедрению искусственного интеллекта для принятия решений на основе данных. Это событие также сделало фокус на генеративные модели гипертрофированным и замело под ковер важную часть слабого ИИ, который применяется в бизнесе уже десятки лет и до сих пор приносит на порядок больше пользы. Руководитель лаборатории машинного обучения Альфа-банка Евгений Смирнов рассуждает о том, когда нужно выбрать именно большую языковую модель и когда, наоборот, эффективнее использовать «дедовские» классы моделей, обученные под узкопрофильную задачу, такие, как логистическая регрессия, градиентный бустинг, метод случайного леса и другие...
08.03.2025
Сообщает: Источник  
Рубрика: «Промышленность и Производство»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Российский классифайд добавил большие языковые модели в свои сервисыРоссийский классифайд добавил большие языковые модели в свои сервисы Авито планирует инвестировать в GenAI порядка 12 млрд рублей и запустить новые образовательные программы для подготовки кадров в области искусственно ...

Большие языковые модели испытывают трудности с координацией в социальных и кооперативных играхБольшие языковые модели испытывают трудности с координацией в социальных и кооперативных играх Большие языковые модели (LLM), такие как модель, лежащая в основе функционирования популярной диалоговой платформы ChatGPT, в настоящее время широко ...

Эксперты группы ЛАНИТ: Большие языковые модели не просто автоматизируют существующие процессы, а создают новые возможности для бизнесаЭксперты группы ЛАНИТ: «Большие языковые модели не просто автоматизируют существующие процессы, а создают новые возможности для бизнеса» В числе проектов группы ЛАНИТ — интеллектуальная система «ИИ-аналитик», которая помогает ускорять отдельные фазы цикла разработки ПО в 5-10 раз; ИИ-с ...

Как бизнесу внедрять языковые модели и почему их сложно создавать в РоссииКак бизнесу внедрять языковые модели и почему их сложно создавать в России Если раньше главные прорывы в области ИИ были связаны с OpenAI, Google и Anthropic, то сегодня появляются новые игроки. Особенно популярны системы ис ...

Малые языковые модели: почему размер больше не имеет значенияМалые языковые модели: почему размер больше не имеет значения Пока гиганты вроде OpenAI тратят миллиарды на создание все более мощных ИИ, умные стартапы делают ставку на компактные решения — и часто выигрывают. ...

OpenAI предложила запретить языковые модели DeepSeek в СШАOpenAI предложила запретить языковые модели DeepSeek в США Как это часто бывает с передовыми для Китая технологиями, разработки DeepSeek быстро нашли недоброжелателей за его пределами. Конкурирующая американс ...

DeepSeek научилась тренировать языковые ИИ-модели без оглядки на ограничения по скорости памятиDeepSeek научилась тренировать языковые ИИ-модели без оглядки на ограничения по скорости памяти Как отмечалось недавно, пропускная способность памяти, используемой в инфраструктуре ИИ, становится одним из серьёзных ограничителей дальнейшего рост ...

Национальные языковые модели: зачем государствам свой ChatGPT и сколько это стоитНациональные языковые модели: зачем государствам "свой ChatGPT" и сколько это стоит Глобальный хайп вокруг искусственного интеллекта превратился в геополитическую гонку. Но вместо гиперлупов - LLM, вместо колоний - дата-центры. И теп ...