Представляем новое поколение графических процессоров для центров обработки данных.
После вчерашнего основного доклада GTC 2022 генеральный директор Дженсен Хуанг представил архитектуру графического процессора Hopper нового поколения и графический процессор Hopper H100. Названная в честь пионера компьютерных наук Грейс Хоппер, Nvidia не раскрыла количество ядер или тактовую частоту, хотя были подтверждены конкретные подробности об архитектуре и пропускной способности.
Узел процесса TSMC 4N
Монолитный чип, изготовленный с использованием специального процесса TSMC 4N и содержащий колоссальные 80 миллиардов транзисторов, представляет собой значительный рост по сравнению с его предшественником Ampere A100, содержащим всего 54 миллиарда транзисторов. A100 выпущен в 2020 году и использует 7-нм техпроцесс TSMC.
Говоря о производительности, Nvidia считает, что H100 предлагает 60 TFLOPS вычислений FP32 по сравнению с 19,5 TFLOPS для A100. Что еще более важно для пользователей такого графического процессора, производительность разреженности TensorFloat-32 выросла более чем в 3 раза — 1000 TLOPS против 312 TLOPS. Тема 3x широко распространена, когда Nvidia ссылается на H100 по отношению к своему прямому предшественнику.
Первое использование памяти HBM3 следующего поколения
Пропускная способность памяти также значительно улучшилась по сравнению с предыдущим поколением. Предлагая до 3 ТБ в секунду, 50-процентное увеличение пропускной способности по сравнению с последним поколением достигается благодаря использованию HBM3, при этом Nvidia становится первым поставщиком ускорителей, использующим версию памяти с высокой пропускной способностью последнего поколения.
Технология межсоединений PCIe 5.0 и NVLink
Nvidia также представила свой интерфейс NVLink четвертого поколения. Реализация NVLink 4 в H100 обеспечивает пропускную способность 900 ГБ/с по сравнению с 600 ГБ/с для интерфейса NVLink третьего поколения A100. Это на 50% больше пропускной способности, а PCIe 5.0 также обеспечивает удвоенную пропускную способность по сравнению с PCIe 4.0.
Трансформаторный двигатель
По словам Nvidia, новый Transformer Engine в чипе H100 обещает ускорить обучение модели до шести раз.
«Transformer Engine, часть новой архитектуры Hopper, значительно повысит производительность и возможности ИИ и поможет обучать большие модели в течение нескольких дней или часов», — сказал Дэйв Сальватор из Nvidia.
Суперчип Grace Hopper
Подводя итог, Nvidia также анонсировала первый ЦП для центра обработки данных, названный «Grace CPU Superchip». Nvidia предложит «суперчипы Grace Hopper», которые объединяют процессор Grace с графическим процессором Hopper в одном модуле. NVLink 4 обеспечивает интерфейс 900 ГБ в секунду между ними.
Хотя Hopper появится в конце этого года в третьем квартале, суперчип Grace Hopper не будет доступен до третьего квартала 2023 года.