Представляем новое поколение графических процессоров для центров обработки данных.
После вчерашнего основного доклада GTC 2022 генеральный директор Дженсен Хуанг представил архитектуру графического процессора Hopper нового поколения и графический процессор Hopper H100. Названная в честь пионера компьютерных наук Грейс Хоппер, Nvidia не раскрыла количество ядер или тактовую частоту, хотя были подтверждены конкретные подробности об архитектуре и пропускной способности.
Монолитный чип, изготовленный с использованием специального процесса TSMC 4N и содержащий колоссальные 80 миллиардов транзисторов, представляет собой значительный рост по сравнению с его предшественником Ampere A100, содержащим всего 54 миллиарда транзисторов. A100 выпущен в 2020 году и использует 7-нм техпроцесс TSMC.
Говоря о производительности, Nvidia считает, что H100 предлагает 60 TFLOPS вычислений FP32 по сравнению с 19,5 TFLOPS для A100. Что еще более важно для пользователей такого графического процессора, производительность разреженности TensorFloat-32 выросла более чем в 3 раза — 1000 TLOPS против 312 TLOPS. Тема 3x широко распространена, когда Nvidia ссылается на H100 по отношению к своему прямому предшественнику.
Пропускная способность памяти также значительно улучшилась по сравнению с предыдущим поколением. Предлагая до 3 ТБ в секунду, 50-процентное увеличение пропускной способности по сравнению с последним поколением достигается благодаря использованию HBM3, при этом Nvidia становится первым поставщиком ускорителей, использующим версию памяти с высокой пропускной способностью последнего поколения.
Nvidia также представила свой интерфейс NVLink четвертого поколения. Реализация NVLink 4 в H100 обеспечивает пропускную способность 900 ГБ/с по сравнению с 600 ГБ/с для интерфейса NVLink третьего поколения A100. Это на 50% больше пропускной способности, а PCIe 5.0 также обеспечивает удвоенную пропускную способность по сравнению с PCIe 4.0.
По словам Nvidia, новый Transformer Engine в чипе H100 обещает ускорить обучение модели до шести раз.
«Transformer Engine, часть новой архитектуры Hopper, значительно повысит производительность и возможности ИИ и поможет обучать большие модели в течение нескольких дней или часов», — сказал Дэйв Сальватор из Nvidia.
Подводя итог, Nvidia также анонсировала первый ЦП для центра обработки данных, названный «Grace CPU Superchip». Nvidia предложит «суперчипы Grace Hopper», которые объединяют процессор Grace с графическим процессором Hopper в одном модуле. NVLink 4 обеспечивает интерфейс 900 ГБ в секунду между ними.
Хотя Hopper появится в конце этого года в третьем квартале, суперчип Grace Hopper не будет доступен до третьего квартала 2023 года.