Яндекс открыл доступ к одному из крупнейших в мире набору данных для развития рекомендательных систем

Яндекс открыл доступ к одному из крупнейших в мире набору данных для развития рекомендательных систем

Команда Яндекса выложила в открытый доступ Yambda (YAndex Music Billion-interactions DAtaset) — один из крупнейших в мире наборов данных (датасетов) для развития рекомендательных систем. Как отметили в пресс-службе, с помощью Yambda учёные, исследователи и вузы со всего мира смогут тестировать и улучшать рекомендательные алгоритмы. Сгенерировано нейросетью Dall-E Датасет представлен в трёх вариантах: полная версия содержит 5 миллиардов данных, уменьшенные — 500 миллионов и 50 миллионов. Разработчики и исследователи смогут выбрать тот вариант, который отвечает их задаче и имеющимся вычислительным ресурсам. Данные датасета и код для замеров доступны на HuggingFace. Yambda создан на основе обезличенных данных «Яндекс Музыки» — крупнейшего подписного музыкального сервиса в России. Как пояснили в Яндексе, использовать его можно для оценки качества любых рекомендательных систем, так как в их основе лежат общие алгоритмы. Yambda включает агрегированные прослушивания, «лайки», «дизлайки», а также некоторые характеристики треков. Все данные о пользователях и треках анонимизированы: датасет содержит исключительно числовые идентификаторы, что обеспечивает конфиденциальность....
28.05.2025
Сообщает: Источник  
Рубрика: «Наука и Техника»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

VK представила датасет для развития рекомендательных системVK представила датасет для развития рекомендательных систем Исследователи AI VK выложили в открытый доступ датасет VK-LSVD (Large Short-Video Dataset). С его помощью инженеры и ученые смогут... ...

40 млрд реакций: VK выложила в свободный доступ датасет для рекомендательных систем40 млрд реакций: VK выложила в свободный доступ датасет для рекомендательных систем VK представила большой открытый датасет VK-LSVD (Large Short-Video Dataset), содержащий 40 миллиардов обезличенных взаимодействий пользователей с кор ...

Яндекс открыл доступ к новой версии нейросети YandexGPT для всехЯндекс открыл доступ к новой версии нейросети YandexGPT для всех Яндекс выпустил новую версию собственной нейросети YandexGPT 5 Lite Яндекс сделал доступной Instruct-версию своей новой модели YandexGPT 5 Lite, кото ...

Яндекс открыл корпоративным клиентам доступ к ИИ-модели Alibaba Qwen 3  самой мощной в ассортименте«Яндекс» открыл корпоративным клиентам доступ к ИИ-модели Alibaba Qwen 3 — самой мощной в ассортименте Подразделение Yandex B2B Tech сообщило об открытии доступа в облачной инфраструктуре к модели искусственного интеллекта Alibaba Qwen3-235B-A22B-Instr ...

Исследователи Сбера стали лучшей командой из РФ на конкурсе рекомендательных систем RecSys Challenge 2025Исследователи Сбера стали лучшей командой из РФ на конкурсе рекомендательных систем RecSys Challenge 2025 Команда исследователей из Центра практического искусственного интеллекта Сбера — ai_lab_recsys — добилась высокого результата в международном соревно ...

Яндекс открывает доступ к нейросети Алиса AI для решения сложных задач прямо из Поиска в приложении Яндекс с Алисой AI«Яндекс» открывает доступ к нейросети «Алиса AI» для решения сложных задач прямо из «Поиска» в приложении «Яндекс с Алисой AI» «Яндекс» интегрировал свою самую мощную нейросеть «Алиса AI» в «Поиск» в приложении «Яндекс — с Алисой AI». Теперь... ...

Stargate для OpenAI: в Техасе строят один из крупнейших центров обработки данных для ИИStargate для OpenAI: в Техасе строят один из крупнейших центров обработки данных для ИИ В городе Абилин, штат Техас, продолжается строительство первого центра обработки данных для инфраструктурного проекта OpenAI Stargate. Ожидается, что ...

Яндекс открыл биржу Telegram-каналов«Яндекс» открыл биржу Telegram-каналов Разработчики «Яндекс» запустили биржу Telegram‑каналов. С июля 2025 г. бренды смогут выбирать конкретные Telegram‑каналы для размещения рекламы в «Ян ...