40 млрд реакций: VK выложила в свободный доступ датасет для рекомендательных систем

40 млрд реакций: VK выложила в свободный доступ датасет для рекомендательных систем

VK представила большой открытый датасет VK-LSVD (Large Short-Video Dataset), содержащий 40 миллиардов обезличенных взаимодействий пользователей с короткими видео. Цель проекта — дать исследователям и инженерам инструмент для разработки и совершенствования рекомендательных алгоритмов, чтобы сервисы и продукты становились более персонализированными. Датасет охватывает шесть месяцев с января по июнь 2025 года и включает данные о 10 миллионах пользователей и 20 миллионах коротких видео. В записи учтены лайки, дизлайки, репосты, продолжительность просмотра и контекст воспроизведения. Все данные представлены в виде числовых идентификаторов, что обеспечивает полную конфиденциальность пользователей. Для каждого видео предоставлен эмбеддинг — числовое описание его содержимого, а для пользователей — социально-демографические характеристики. Короткие видео отличаются от других форматов контента, так как их невозможно прослушивать в фоновом режиме. Любое взаимодействие пользователя, будь то просмотр ролика до конца или пропуск, уже считается обратной связью для алгоритма. Это делает данные особенно ценными для обучения рекомендательных систем. Датасет создан так, чтобы исследователи могли гибко настраивать выборку под свои задачи. Можно выбирать объём данных, способ отбора — случайным образом или по популярности видео. Такой подход позволяет адаптировать VK-LSVD как для...
27.08.2025
Сообщает: Источник  
Рубрика: «Наука и Техника»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

VK представила датасет для развития рекомендательных системVK представила датасет для развития рекомендательных систем Исследователи AI VK выложили в открытый доступ датасет VK-LSVD (Large Short-Video Dataset). С его помощью инженеры и ученые смогут... ...

Яндекс открыл доступ к одному из крупнейших в мире набору данных для развития рекомендательных системЯндекс открыл доступ к одному из крупнейших в мире набору данных для развития рекомендательных систем Команда Яндекса выложила в открытый доступ Yambda (YAndex Music Billion-interactions DAtaset) — один из крупнейших в мире наборов данных (датас ...

Исследователи Сбера стали лучшей командой из РФ на конкурсе рекомендательных систем RecSys Challenge 2025Исследователи Сбера стали лучшей командой из РФ на конкурсе рекомендательных систем RecSys Challenge 2025 Команда исследователей из Центра практического искусственного интеллекта Сбера — ai_lab_recsys — добилась высокого результата в международном соревно ...

МТС в Татарстане открыла в своих салонах свободный доступ к Wi-FiМТС в Татарстане открыла в своих салонах свободный доступ к Wi-Fi МТС развернула сеть бесплатных точек беспроводного доступа в интернет в Казани, Набережных Челнах, Нижнекамске... ...

Nival выложила в открытый доступ исходники Блицкриг 2Nival выложила в открытый доступ исходники «Блицкриг 2» Недавно второй части культовой RTS про Вторую мировую войну «Блицкриг 2» исполнилось 20 лет: ее релиз состоялся 23 сентября 2005-го. По этому поводу ...

Сервис Свободный доступ обработал свыше 1,2 тыс. сигналов горожан о незаконных шлагбаумах и заборах в 2025 годуСервис «Свободный доступ» обработал свыше 1,2 тыс. сигналов горожан о незаконных шлагбаумах и заборах в 2025 году Свыше 250 фактов самовольной установки ограждающих устройств подтвердили в Москве благодаря обращениям жителей... ...

EA выложила исходный код классических игр Command & Conquer в открытый доступEA выложила исходный код классических игр Command & Conquer в открытый доступ EA объявила об интересном событии для поклонников Command & Conquer — она выпускает исходный код нескольких классических игр и добавляет поддержку St ...

Nvidia выложила в открытый доступ систему для обучения человекоподобных роботовNvidia выложила в открытый доступ систему для обучения человекоподобных роботов На конференции Nvidia GTC 2025 вендор представил новую модель искусственного интеллекта — Isaac GROOT N1. Компания называет эту систему «первой откры ...