Поиск по сайту:
Симметрия представляет собой концепцию, сокращающую сложность (сопрограммы содержат подпрограммы); ищите ее повсюду. (Алан.Дж.Перлис)

Nvidia представляет архитектуру графического процессора Hopper следующего поколения

23.03.2022
Nvidia представляет архитектуру графического процессора Hopper следующего поколения

Представляем новое поколение графических процессоров для центров обработки данных.

После вчерашнего основного доклада GTC 2022 генеральный директор Дженсен Хуанг представил архитектуру графического процессора Hopper нового поколения и графический процессор Hopper H100. Названная в честь пионера компьютерных наук Грейс Хоппер, Nvidia не раскрыла количество ядер или тактовую частоту, хотя были подтверждены конкретные подробности об архитектуре и пропускной способности.

 

Узел процесса TSMC 4N

Монолитный чип, изготовленный с использованием специального процесса TSMC 4N и содержащий колоссальные 80 миллиардов транзисторов, представляет собой значительный рост по сравнению с его предшественником Ampere A100, содержащим всего 54 миллиарда транзисторов. A100 выпущен в 2020 году и использует 7-нм техпроцесс TSMC.

Говоря о производительности, Nvidia считает, что H100 предлагает 60 TFLOPS вычислений FP32 по сравнению с 19,5 TFLOPS для A100. Что еще более важно для пользователей такого графического процессора, производительность разреженности TensorFloat-32 выросла более чем в 3 раза — 1000 TLOPS против 312 TLOPS. Тема 3x широко распространена, когда Nvidia ссылается на H100 по отношению к своему прямому предшественнику.

 

Первое использование памяти HBM3 следующего поколения

Пропускная способность памяти также значительно улучшилась по сравнению с предыдущим поколением. Предлагая до 3 ТБ в секунду, 50-процентное увеличение пропускной способности по сравнению с последним поколением достигается благодаря использованию HBM3, при этом Nvidia становится первым поставщиком ускорителей, использующим версию памяти с высокой пропускной способностью последнего поколения.

Технология межсоединений PCIe 5.0 и NVLink

Технология межсоединений PCIe 5.0 и NVLink

 

Читать  Micron GDDR7 улучшает производительность графических процессоров Nvidia до 30% в играх

Nvidia также представила свой интерфейс NVLink четвертого поколения. Реализация NVLink 4 в H100 обеспечивает пропускную способность 900 ГБ/с по сравнению с 600 ГБ/с для интерфейса NVLink третьего поколения A100. Это на 50% больше пропускной способности, а PCIe 5.0 также обеспечивает удвоенную пропускную способность по сравнению с PCIe 4.0.

 

Трансформаторный двигатель

По словам Nvidia, новый  Transformer Engine  в чипе H100 обещает ускорить обучение модели до шести раз.

«Transformer Engine, часть новой архитектуры Hopper, значительно повысит производительность и возможности ИИ и поможет обучать большие модели в течение нескольких дней или часов», — сказал Дэйв Сальватор из Nvidia.

 

Суперчип Grace Hopper

Суперчип Grace Hopper

 

Подводя итог, Nvidia также анонсировала первый ЦП для центра обработки данных, названный «Grace CPU Superchip». Nvidia предложит «суперчипы Grace Hopper», которые объединяют процессор Grace с графическим процессором Hopper в одном модуле. NVLink 4 обеспечивает интерфейс 900 ГБ в секунду между ними.

Хотя Hopper появится в конце этого года в третьем квартале, суперчип Grace Hopper не будет доступен до третьего квартала 2023 года.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...
Поделиться в соц. сетях:


0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest

**ссылки nofollow

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Это может быть вам интересно


Рекомендуемое
Intel надеется подлить масла в огонь высокопроизводительных ноутбуков, выпустив в…

Спасибо!

Теперь редакторы в курсе.