Когда дело доходит до графических процессоров, Nvidia является ведущим экспертом. Находясь в бизнесе с 1993 года, Nvidia произвела широкий спектр высококачественных профессиональных и потребительских графических процессоров. Уважаемые архитектуры их процессоров стоят за успехом их продуктов, особенно их основной линейки, GeForce. Графические процессоры Nvidia вышли за рамки игрового пространства, расширив свое присутствие в области глубокого обучения, ИИ (искусственного интеллекта) и ускоренной аналитики. Nvidia проникла на рынок центров обработки данных десять лет назад, начав с чипов Fermi. Были сделаны последующие итерации, и компания постоянно выпускала графические процессоры, удовлетворяющие ненасытный спрос на более высокую скорость обработки в центрах обработки данных. Графические процессоры Nvidia развивались на протяжении многих лет, и дизайн архитектуры в первую очередь движет эволюцией.
Конкуренция среди производителей графических процессоров очень высока, но Nvidia ничего не сдерживает, чтобы занять первое место. Фактически, Nvidia доминировала на рынке искусственного интеллекта в последнее десятилетие. В 2020 году новости о первом 7-нм (8-нм для потребительских компонентов) графическом процессоре Nvidia с 54 миллиардами транзисторов, сжатых в таком маленьком кристалле, вызвали настоящий ажиотаж. Под кодовым названием Ampere в честь французского математика Андре-Мари Ампера, архитектура процессора Nvidia значительно превосходит своих предшественников, Turing и Volta, обещая больше функциональных возможностей, лучшую эффективность и более высокую производительность при более низких уровнях мощности. Ampere стоит за вторым поколением графических процессоров RTX от Nvidia, серией RTX 30, и, как говорят, в два раза быстрее, чем их аналоги серии RTX 20. Архитектура Ampere также является движущей силой графических процессоров для центров обработки данных Nvidia A100.
Ampere — это первый 7-нм / 8-нм графический процессор Nvidia, второе поколение потребительской трассировки лучей и третье поколение тензорных ядер. Ampere является базовой архитектурой графических процессоров GA100, GA102 и GA104, которые встроены в GeForce RTX 3090, RTX 3080, RTX 3070 и, совсем недавно, в RTX 3060. Nvidia также планирует выпустить RTX 3050 в следующие месяцы. Между тем, корпоративный графический процессор GA100 обеспечивает в 20 раз большую вычислительную мощность, чем графические процессоры для центров обработки данных предыдущих поколений. Вот обзор профессиональных и потребительских графических процессоров Nvidia Ampere [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Видеокарта | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Процесс (нм) | TSMC N7 | Samsung 8N | Samsung 8N | Samsung 8N |
Транзисторы (млрд) | 54 | 28,3 | 28,3 | 17,4 |
Размер матрицы (мм ^ 2) | 826 | 628,4 | 628,4 | 392,5 |
Конфигурация GPC | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
Смс | 108 | 82 | 68 | 46 |
Ядра CUDA | 6912 | 10496 | 8704 | 5888 |
Ядра RT | Никто | 82 | 68 | 46 |
Тензорные ядра | 432 | 328 | 272 | 184 |
Частота разгона (МГц) | 1410 | 1700 | 1710 г. | 1730 |
Скорость видеопамяти (Гбит/с) | 2,43 | 19,5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (ГБ) | 40 (48 макс.) | 24 | 10 | 8 |
Ширина автобуса | 5120 (6144 макс.) | 384 | 320 | 256 |
ROP | 128 | 112 | 96 | 96 |
TMU | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 | 35686 | 29768 | 20372 |
RT TFLOPS | N / A | 69 | 58 | 40 |
Тензор TFLOPS FP16 (разреженный) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Пропускная способность (ГБ/с) | 1555 | 936 | 760 | 448 |
TBP (Вт) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100 — первый графический процессор, использующий архитектуру Ampere. Корпоративный чип предназначен для центров обработки данных и предназначен для задач с интенсивным использованием графических процессоров, таких как глубокое обучение и искусственный интеллект. Созданный с использованием 7-нм техпроцесса TSMC, он содержит огромное количество из 54 миллиардов транзисторов. Он превзошел предыдущие поколения корпоративных графических процессоров с 20-кратным увеличением производительности благодаря 6912 ядрам CUDA, 432 блокам отображения текстур, 160 ROP, ядрам Tensor третьего поколения и 40 ГБ видеопамяти с пропускной способностью памяти, которая достигает максимума 1,6 ТБ/с. DGX A100 — первая в мире система искусственного интеллекта с кластером из восьми A100 и внушительной ценой в 199 000 долларов.
Помимо доминирования на корпоративном рынке, Nvidia всегда думает о потребителях, особенно о геймерах и создателях. Архитектура Ampere также используется в потребительских видеокартах Nvidia. Второе поколение GeForce RTX оснащено графическими процессорами на базе Ampere, которые увеличивают производительность вдвое по сравнению с предыдущим поколением.
В большинстве аспектов вычислительная мощность Ampere более чем в два раза превосходит вычислительную мощность Тьюринга. Он вдвое увеличил производительность шейдеров Тьюринга, вдвое увеличив количество ядер FP32 CUDA. В частности, он имеет 30 шейдерных терафлопс, что в 2,7 раза больше, чем у Тьюринга, который составляет всего 11 шейдерных терафлопс. Точно так же тензорное ядро Тьюринга измеряет 89 тензор-терафлопс, но Ampere более чем удвоил этот показатель с его 238 тензор-терафлопс. Чтобы не забывать о скорости ядра трассировки лучей, которая составляет 58 RT-TFLOPS, что в 1,7 раза быстрее, чем у Turing 34 RT-TFLOPS, и чтобы графические процессоры работали еще быстрее, чип Ampere подключается к самой быстрой в мире памяти, Micron G6X.
Серия RTX 30 сделана с использованием Samsung 8N Nvidia Custom Process с 28 миллиардами транзисторов для GA102 и 17 миллиардами транзисторов для GA104. RTX 3090 класса Titan оснащен графическим процессором GA102 и обеспечивает чрезвычайно высокую производительность потребительских карт. В отличие от предыдущих поколений, RTX 3090 открыт для третьих сторон для индивидуального проектирования.
RTX 3080 также использует графический процессор GA102, обеспечивающий вдвое большую производительность, чем RTX 2080, и впечатляющее игровое мастерство 4K. RTX 3070 на базе графического процессора GA104 находится на одном уровне с RTX 2080 Ti за половину цены. Недавно выпущенный RTX 3060 также никогда не перестает впечатлять своей потрясающей производительностью, обусловленной улучшенными ядрами трассировки лучей, тензорными ядрами, новыми потоковыми мультипроцессорами и высокоскоростной памятью G6.
Несмотря на значительное увеличение производительности, новые графические процессоры RTX не так уж и тяжелы. Когда дело доходит до цены, гораздо более быстрые видеокарты легко доступны. Флагман Nvidia GeForce, RTX 3080, стоит от 699 долларов, RTX 3070 продается по цене 499 долларов, а RTX 3060 стоит 329 долларов. Более дорогая RTX 3090 стоит 1499 долларов; по-прежнему достаточно дешевый, учитывая его производительность на уровне Титана.
Спустя всего несколько месяцев после его выпуска, как сообщается, возникла нехватка видеокарт на базе Ampere, и это не удивительно с потрясающей производительностью Ampere по разумной цене. Для тех, кто рассматривает возможность обновления графического процессора, сейчас лучшее время, чтобы заполучить графические процессоры Nvidia на базе Ampere.