FP64 у вас ненастоящий: AMD сомневается в эффективности эмуляции научных расчётов на тензорных ядрах NVIDIA

FP64 у вас ненастоящий: AMD сомневается в эффективности эмуляции научных расчётов на тензорных ядрах NVIDIA

Вместо создания специализированных чипов для аппаратных FP64-вычислений NVIDIA использует эмуляцию для повышения производительности HPC на ИИ-ускорителях, пишет The Register. Компания отказалась от развития FP64-блоков в поколении Blackwell Ultra, а в новейших ускорителях Rubin пиковая заявленная производительность векторных FP64-вычислений составляет 33 Тфлопс, тогда как у H100, вышедшего четыре года назад, она была равна 34 Тфлопс, а у Blackwell — около 40 Тфлопс. Если включить программную эмуляцию в библиотеках CUDA от NVIDIA, ускоритель, как утверждается, может достичь производительности до 200 Тфлопс в матричных FP64-вычислениях. Впрочем, и Blackwell с эмуляций способен выдать в этом случае до 150 Тфлопс, тогда как у Hopper были «честные» 67 Тфлопс. «В ходе многочисленных исследований с партнёрами и собственных внутренних изысканий мы обнаружили, что точность, достигаемая с помощью эмуляции, как минимум не уступает точности, получаемой от аппаратных тензорных ядер», — сообщил ресурсу The Register Дэн Эрнст (Dan Ernst), старший директор по суперкомпьютерным продуктам NVIDIA....
20.01.2026
Сообщает: Источник  
Рубрика: «Hardware»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

5-й статьи нет и никогда не было  Залужный сомневается в эффективности Устава НАТО«5-й статьи нет и никогда не было» — Залужный сомневается в эффективности Устава НАТО В Польше активно обсуждают откровения экс-командующего ВСУ, а ныне посла Украины в Лондоне Валерия Залужного. Дело в том, что бандеровский генерал ус ...

NextSilicon Maverick-2: FP64, HBM3E и Dataflow  новая заявка на HPC-рынокNextSilicon Maverick-2: FP64, HBM3E и Dataflow — новая заявка на HPC-рынок Израильская компания NextSilicon представила процессор Maverick-2, который после восьми лет разработки претендует на роль альтернативы традиционным в ...

Историческое событие: энтузиасты впервые самостоятельно портировали игру с Xbox 360 на ПК без эмуляцииИсторическое событие: энтузиасты впервые самостоятельно портировали игру с Xbox 360 на ПК без эмуляции Спустя 16 лет после выхода, Sonic Unleashed получил полноценный нативный порт на ПК, созданный энтузиастами. Проект Unleashed Recompiled основан на и ...

Пишут, что я там ненастоящий. Дмитрий Шепелев ответил на критику из-за интервью, в котором он рассказывал о Жанне Фриске"Пишут, что я там ненастоящий". Дмитрий Шепелев ответил на критику из-за интервью, в котором он рассказывал о Жанне Фриске Дмитрий Шепелев отреагировал на обвинения в свой адрес после интервью Надежде Стрелец, где он подробно рассказал свою версию истории болезни и смерти ...

Intel Core Ultra 7 270K Plus работает на 24 ядрах при 5,4 ГГцIntel Core Ultra 7 270K Plus работает на 24 ядрах при 5,4 ГГц Intel готовит обновлённую линейку Arrow Lake для настольных ПК, которая выйдет в следующем году и получит небольшие улучшения по тактовой частоте. Ра ...

Nova Lake-S: снова сообщается о 52 ядрах (обновление)Nova Lake-S: снова сообщается о 52 ядрах (обновление) Пока Intel испытывает трудности в борьбе с AMD на рынке настольных процессоров, ожидается, что ситуация изменится с выходом следующего поколения — No ...

Китайские астрофизики раскрыли сложную динамику газа в активных галактических ядрахКитайские астрофизики раскрыли сложную динамику газа в активных галактических ядрах Группа учёных из Юньнаньской обсерватории Китайской академии наук опубликовала новое исследование, посвящённое изучению внутренних и внешних областей ...

MediaTek представила Dimensity 9500  конкурент Apple A19 Pro и первый процессор на ядрах Arm C1 и частотой до 4,21 ГГцMediaTek представила Dimensity 9500 — конкурент Apple A19 Pro и первый процессор на ядрах Arm C1 и частотой до 4,21 ГГц Компания MediaTek представила микропроцессор Dimensity 9500, который построен на базе новейших ядер Arm C1 и предназначен для флагманских смартфонов. ...