ИТ Блог. Администрирование серверов на основе Linux (Ubuntu, Debian, CentOS, openSUSE)

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

Arc обещает многое. Мы проверяем, соответствует ли он спецификациям.

После многих лет спекуляций и месяцев ажиотажа Intel наконец-то готова выйти на рынок дискретных видеокарт. Сегодня Team Blue официально анонсирует семейство графических процессоров Arc, начиная с Arc 3, Arc 5 и Arc 7, предназначенных для тонких и легких игровых ноутбуков.

Решение Intel под кодовым названием Alchemist использовать технологию Arc dGPU для мобильных устройств в буквальном смысле слова говорит о рыночных возможностях. Arc 3 уже доступен для некоторых ноутбуков, а Arc 5 и Arc 7 появятся летом. Давайте рассмотрим Arc с точки зрения нисходящего подхода.

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Arc 3 уже доступен

Arc 3 начального уровня предназначен для того, чтобы предложить геймерам-казуалам еще один шаг вперед по сравнению со встроенной графикой. Arc A350M и A370M, доступные в двух вариантах, различающихся характеристиками и мощностью, охватывают популярную территорию TDP 25–50 Вт.

Оба построены на одном и том же базовом 6-нм кремнии TSMC и имеют общий набор функций, который распространяется на все графические процессоры Arc. Если приложение или игра запускаются на одном из них, они запускаются и на всех, хотя и медленнее на младших моделях.

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Эта стратегия наиболее любопытна в отношении аппаратной трассировки лучей, доступной даже на A350M, и, учитывая слабую производительность, проявляемую картами Radeon и GeForce начального уровня с этими встроенными точными интеллектуальными функциями освещения, мы не ожидаем многого от Дополнение Arc 3 из шести и восьми единиц. Упражнение с флажком больше, чем реальная полезность? Жюри совещается.

При уменьшении масштаба все мобильные графические процессоры Arc используют одну из двух SoC, известных как ACM-G10 и ACM-G11. Понятно, что A350M и A370M используют меньший по размеру и компактный кремний G11, который ограничен восемью ядрами Xe и 96-битной шиной памяти; все остальные работают на значительно большем G10, который в четыре раза мощнее.

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

На первый взгляд частоты кажутся низкими, работая от 900 МГц до 1650 МГц. Intel говорит, что это сделано намеренно и не должно сравниваться со спецификациями конкурентов. Почему? Потому что частота Arc определяется самой большой рабочей нагрузкой и самым низким TDP для этого класса графических процессоров. Например, A370M должен запускать самую сложную игру с большим количеством шейдеров и трассировки лучей при гарантированных 1550 МГц и 35 Вт TDP. Весьма вероятно, что фактические часы будут намного выше, поэтому Team Blue хочет занижать обещания и делать больше.

Intel сокращает пропускную способность PCIe 4.0 вдвое для G11 до x8, и это распространено в отрасли для более дешевых графических процессоров. Положительным моментом является то, что медиа-движок, к которому мы вернемся позже, сохраняется нетронутым во всех продуктах Arc. Intel считает, что в этом отношении у нее лучшие в своем классе технологии и производительность.

 

Микроархитектура Xe HPG

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

По аналогии с потоковыми мультипроцессорами Nvidia и вычислительными модулями AMD, Intel закладывает основу мощности Arc с помощью микроархитектуры Xe HPG, содержащейся в ядрах Xe, а затем и Xe Render Slices. Об этом было объявлено на Дне архитектуры 2021 года, но стоит повторить.

Render Slice — это совокупность технологий, используемых в качестве основы каждого графического процессора Arc. One Slice содержит четыре ядра Xe, используемых для растеризации, и четыре модуля трассировки лучей для вычисления пересечения лучей и пересечения треугольников. Например, восемь таких Slice составляют 32-ядерный Arc 7 A770M. Это означает, что более крупные графические процессоры Arc имеют линейное увеличение во всех ключевых вычислительных блоках. Вернитесь на пару слайдов вверх, и вы заметите, что A350M начального уровня с шестью ядрами Xe на самом деле использует два Render Slices, вероятно, с деактивированным ядром в каждом.

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Каждое ядро ​​Xe само состоит из 16 256-битных векторных движков SIMD (или EU) для обработки растеризации. Фиолетовым цветом выделены 16 матричных движков (XMX), оптимизированных для обработки новых задач ИИ. Подобно тензорным ядрам Nvidia, эти движки фактически представляют собой гигантские калькуляторы матричного умножения.

Существует общий пул памяти объемом 192 КБ на каждое ядро ​​Xe, который динамически настраивается драйвером либо в качестве стандартного кэша L1, либо в качестве общей локальной памяти. Если многое в ядре кажется знакомым, то это так, поскольку Intel использует опыт предыдущего поколения Xe LP, поддерживая новейшую интегрированную графику, и добавляет лучшие части в Xe HPG, добавляя современные технологии. Intel заявляет о 1,5-кратном преимуществе производительности на ватт по сравнению с собственным IGP, но насколько это применимо к процессам, а сколько — к достижениям микроархитектуры, неизвестно.

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Идя глубже, каждый векторный движок Xe — помните, что это движки, а не автономные ядра — теперь имеет выделенный порт выполнения операций с плавающей запятой, и, как и в последних разработках Nvidia, операции с плавающей запятой могут выполняться вместе с целочисленными инструкциями, сохраняя при этом работу ядер. типов инструкций в игровом коде становится более равным.

Каждый векторный движок является домом для восьми ALU или шейдеров в традиционном смысле, поэтому, если вы выполните всю математику, A350M имеет 6 ядер Xe, содержащих 16 векторных движков, содержащих 8 ALU, то есть в сумме 768. Между тем A770M имеет 32 ядра Xe или 4096 шейдеров (32x16x8).

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Присмотревшись к одному из 16 движков XMX, содержащихся в каждом ядре, видно, что его пропускная способность в четыре раза выше, чем у векторного движка. Обычно работая совместно с данными более низкой точности для вычислений ИИ, обычно 8-битными, XMX выполняет 256 операций за такт. Если вы уберете только один аспект из этого обсуждения, то пусть это будет так: Intel выделяет разумный кусок кремниевой недвижимости для специализированных процессоров для ИИ, подчеркивая, куда, по ее мнению, движутся игры и общие рабочие нагрузки графического процессора. Архитекторы графических процессоров инвестируют в оборудование только тогда, когда требование очевидно и его невозможно игнорировать.

Важно понимать, что механизмы Vector и XMX не существуют изолированно. Совместное использование ресурсов является ключом к тому, чтобы размер кристалла был как можно меньше, а пропускная способность была высокой, и все три типа инструкций — с плавающей запятой, целочисленные и XMX — могут выполняться одновременно.

Почему весь этот фокус на ИИ? Первым плодом этих интегрированных движков является Xe Super Sampling, который похож на технологию Nvidia DLSS по масштабам и амбициям. Рендеринг изображения с более низким разрешением и заполнение недостающих пробелов точности с помощью Xe SS позволяет получать псевдовысокое разрешение с повышенной частотой кадров за счет использования возможностей ИИ.

Поймите, что это не фильтр алгоритма, который можно применить к любой игре; Xe SS должен быть реализован разработчиком для каждого движка отдельно, и у них будет выбор: использовать либо стандартную версию XMS, либо набор инструкций DP4a с настроенной производительностью. Мы удивляемся их энтузиазму по поводу потенциальной интеграции как DLSS, так и Xe SS в одну игру, особенно для игр уровня Triple-A, в которых DLSS уже находится в разработке. Нет никаких сомнений в том, что тесные отношения с разработчиками являются ключом к будущему Xe SS.

 

Современный мультимедийный движок

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Intel утверждает, что в каждый графический процессор Arc встроен лучший в отрасли медиа-движок. Особого внимания заслуживает аппаратное кодирование AV1, которое является первым. Имеет смысл на мобильных устройствах для создателей, которые хотят упаковать свои видео с файлами наименьшего размера и высочайшего качества.

Блок двигателя поддерживает HDMI 2.0b, DisplayPort 1.4a (2.0-ready) и выводит на четыре дисплея с разрешением до 4K120 HDR, два дисплея с разрешением 8K60 HDR и частотой обновления 1440p360. Удачи вам в получении таких высоких результатов на графических процессорах для ноутбуков, но, тем не менее, приятно видеть возможности. Что странно, так это включение HDMI 2.0b вместо 2.1; мы не можем себе представить, почему Intel сделала это.

Графические процессоры Arc поддерживают технологию адаптивной частоты кадров Vesa и делают еще один шаг вперед благодаря собственной технологии, известной как Speed ​​Sync. Оптимизированные для киберспортивных игр со сверхвысокой частотой кадров и работающие с отключенной вертикальной синхронизацией, умные устройства интеллектуально скрывают самые последние кадры от игрового движка и дают указание дисплею отображать только самые последние завершенные кадры. Цель этого сокрытия — гарантировать отсутствие разрывов, скажем, на частоте 240 Гц и выше. Трудно разобраться без тестирования, это одна из функций, о которой мы очень хотим узнать больше.

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Тем временем Smooth Sync делает что-то немного другое. Доступный на всех графических процессорах Arc, он работает, сглаживая видимые разрывы путем смешивания 32 строк развертки на пересечении двух кадров. Это, конечно, не избавляет от слез, но сглаживает их, чтобы они были менее заметными для глаз. Зачем это делать, если адаптивная синхронизация полностью избавляет от разрывов? Intel говорит, что Smooth Sync полезен для ноутбуков начального уровня и дисплеев, где адаптивная синхронизация недоступна с панели.

 

Представление

Обладая всеми преимуществами DirectX 12 Ultimate, такими как трассировка лучей, затенение с переменной скоростью, затенение сетки и обратная связь сэмплера, все это делает Arc полностью современным.

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Intel только сравнила производительность Arc A370M с собственной интегрированной графикой Iris Xe, содержащейся в чипе Core i7-1280P. Это не слишком полезно; сравнение с младшими дискретными мобильными графическими процессорами Nvidia и AMD было бы гораздо поучительнее и полезнее.

Тем не менее, Arc A370M, работающий в диапазоне 35-50 Вт и, следовательно, подходящий для тонких и легких ноутбуков, обеспечивает почти вдвое большую производительность в ряде популярных и тяжелых игр. 1080p60 достигается, но мы не знаем точных настроек и используемых уровней качества. Судя по этим цифрам, Arc A350M едва ли будет быстрее встроенной графики премиум-класса, и точно неизвестно, как он сравнивается с мобильным устройством Ryzen 6000 Series на базе RDNA 2 . По словам Intel, Arc также быстрее справляется с рабочими нагрузками создателей и должным образом демонстрирует слайды, иллюстрирующие этот факт.

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Максимально увеличивая мощность там, где это необходимо больше всего, все ноутбуки 12-го поколения Core и Arc поддерживают то, что фирма называет технологией Deep Link. Короче говоря, он динамически увеличивает мощность графического процессора или процессора в зависимости от рабочей нагрузки — AMD SmartShift, кто-нибудь? – и может привести к дополнительному повышению производительности на 20-30% по сравнению с работой обоих процессоров в отдельных силосах.

Интересной особенностью объединения мобильной интегрированной графики 12-го поколения с дискретными графическими процессорами Arc является Hyper Encode. Разбивая видеопоток на блоки по 15-30 кадров и распределяя работу между IGP ЦП или ядрами графического процессора, Intel заявляет, что может значительно повысить производительность. Думайте об этом как о мульти-GPU для видео, и он работает лучше всего, если и IGP, и dGPU одинаково согласованы. Та же стратегия комбинирования применима и к вычислительным рабочим нагрузкам под эгидой Hyper Compute.

Intel выпускает первые графические процессоры Arc — раскрыты спецификации и тесты

 

Первые ноутбуки с процессорами Core и Intel Arc 12-го поколения уже доступны по цене от 899 долларов. Эта сумма приводит в действие дискретные графические процессоры Arc 3. Ожидайте множество других объявлений в ближайшие несколько недель; Intel рассчитывает, что несколько моделей поступят в продажу позже в апреле.

 

Выводы

Если говорить в первую очередь о ноутбуках, дискретная графика Intel Arc предназначена для обеспечения производительности, превосходящей IGP, и позволяет запускать современные игры с разрешением 1080p60. Arc — это перспективная архитектура, охватывающая несколько сегментов.

Мы не уверены в возможностях трассировки лучей для Arc 3, не совсем понимаем отсутствие HDMI 2.1 и не ошеломлены показателями производительности, предоставленными Intel.

Тем не менее, еще один выход на рынок дискретных графических процессоров можно рассматривать только как положительный момент. Многообещающие цифры тестов покажут все, но совершенно ясно, что сейчас самое время задуматься об игровом ноутбуке.

Exit mobile version