Следуя общему представлению на вчерашней премьере центра обработки данных и технологий искусственного интеллекта в Сан-Франциско, AMD поделилась дополнительной информацией о технологии и реализации чипов Epyc 4-го поколения «Bergamo».
Эти процессоры используют совершенно новую архитектуру Zen 4c, которая обеспечивает большую плотность ядер, чем Genoa, работающая на всем протяжении до 128 ядер и 256 потоков на чип. Предлагая точно такую же совместимость с ISA и программным обеспечением, различия между ними на самом деле незначительны, что говорит о встроенной модульности между конструкциями Epyc 4-го поколения.
С точки зрения архитектуры barebone единственным существенным отличием является уменьшение вдвое объема кэш-памяти L3 на ядро, с 4 МБ до 2 МБ, но сам по себе этот шаг недостаточно эффективен для уменьшения площади на необходимый уровень, чтобы вместить на 33% больше ядер. и потоков, сохраняя при этом желаемый операционный бюджет <400 Вт.
Фактически, AMD указывает на 35-процентную экономию площади между двумя конструкциями, основываясь на сравнении равного количества ядер и сопутствующего кэша L2, который, как показано на приведенном выше графике, не изменился в размере между поколениями. Идет какой-то подвох.
Первое серьезное изменение связано с тем, как AMD строит штампы Bergamo по сравнению с действующей Genoa. Если вы помните, в Genoa используется до 12 ПЗС-матриц, каждая из которых содержит один CCX с восемью ядрами, всего 96 на процессоре 9654. Bergamo, с другой стороны, удваивает количество CCX на ПЗС, тем самым предлагая по 16 ядер каждая. Зная, что в данном случае имеется максимум восемь ПЗС-матриц, простая математика приводит нас к топовым 128 ядрам. Стоит повторить, что, хотя в Bergamo в целом больше ядер, в нем меньше ПЗС-матриц с большей плотностью. Есть ли в будущем возможность появления чипа Bergamo с 12 ПЗС-матрицами, подобного Genoa, со 192 ядрами и 384 потоками? Разум затуманивается.
Возвращаясь к уменьшению вдвое кэш-памяти L3 на ядро, поймите, что на самом деле она остается неизменной для традиционной ПЗС-матрицы, поэтому каждая из них содержит 32 МБ на Genoa, хотя расположение немного отличается, поскольку это 2×16 МБ, а не 1×32 МБ. Максимальная мощность также остается на уровне 400 Вт, поэтому намек на то, что AMD снижает частоты Bergamo для размещения большего количества ядер.
Это ослабление частот, которое мы задокументируем ниже, позволяет AMD отказаться от некоторого кремния, связанного с синхронизацией и буферизацией. Кроме того, хотя объем кэш-памяти L1 и L2 остается таким же, как и в Genoa, AMD использует более плотную SRAM для экономии места. Результатом этого подхода, вероятно, будет снижение пиковой производительности. И последнее, но не менее важное: для Bergamo нет модели с 3D V-Cache, что позволяет дополнительно экономить кремний за счет отсутствия необходимой технологии TSV.
Тем не менее, даже если вы суммируете эту экономию кремния, уменьшение площади кэш-памяти ядра и L2 на 35 процентов впечатляет, учитывая, что AMD не использует меньший производственный узел; остается 5 нм для вычислений и 6 нм для IOD.
Это много, чтобы принять во внимание, поэтому вот простая таблица, определяющая ключевые характеристики между обычными процессорами Genoa и Bergamo.
Genoa 9654 | Bergamo 9754 | |
Максимальное количество ядер/потоков | 96/192 | 128/256 |
CCX на ПЗС | 1 | 2 |
Ядер на CCX | 8 | 8 |
Всего ПЗС | 12 | 8 |
Кэш L3 на ПЗС | 32 МБ | 2×16 МБ |
Общий кэш L3 | 384 МБ | 256 МБ |
Каналы DDR5 | 12 | 12 |
линии PCIe 5.0 | 128 | 128 |
Диапазон бюджета мощности | 320 – 400 Вт | 320 – 400 Вт |
Базовые/повышающие частоты | 2,4 ГГц / 3,7 ГГц | 2,25 ГГц / 3,1 ГГц |
Поставка гипермасштабным клиентам сейчас, Bergamo производится в виде трех процессоров. Epyc 9754 — это чип верхнего стека, предлагающий полный комплект из 128 ядер и 256 потоков. Иллюстрируя вышеприведенную точку энергосбережения, AMD ограничивает частоту процессора Genoa 9654 с базовой 2,4 ГГц и повышает ее с 3,7 ГГц до 2,25 ГГц и 3,1 ГГц. Это значительное снижение, но поскольку облачные приложения, как правило, предпочитают ядра частоте, это необходимое снижение частоты — чтобы уложиться в бюджет 400 Вт на чип — имеет смысл.
Bergamo также предлагает версию без SMT с суффиксом S, работающую на 128 ядер и 128 потоков, хотя несколько удивительно, что она имеет тот же показатель TDP 360 Вт по умолчанию. Малышом в этой группе является Epyc 9734, оснащенный 112 ядрами и 224 потоками, предположительно построенный либо путем отключения ПЗС, либо путем запуска 14 из 16 ядер в каждой из восьми ПЗС.
Предлагаемое AMD расширение производства процессоров, оптимизированных для облачных вычислений, представлено тремя чипами Bergamo на базе Zen 4c. Используя измененный дизайн базовой модели Genoa, плотность и компактность сердцевины были достигнуты умным способом. Однако конкурент Intel не стоит на месте в этой области и в следующем году увидит выпуск процессоров Sierra Forest, оснащенных до 144 E-ядер, построенных на передовом техпроцессе Intel 3.