Ежегодно отгружается более миллиарда мобильных графических процессоров на базе Arm Mali. На сегодняшний день партнерами произведено более восьми миллиардов штук. В основном представленный в смартфонах, этот диапазон возглавляет Mali-G710, который является неотъемлемой частью SoC, таких как Dimensity 9000 от MediaTek.
Immortalis, построенный на базе Mali, является первым графическим процессором Arm, предлагающим аппаратную трассировку лучей. Продолжая разговоры на недавнем технологическом дне, Арм убежден, что мобильные решения премиум-класса — смартфоны и ноутбуки — в самом ближайшем будущем потребуют аппаратной трассировки лучей, затенения с переменной скоростью и интеллекта машинного обучения.
Immortalis-G715
На фундаментальном уровне Immortalis-G715 берет строительные блоки Mali-G710 (3-го поколения Valhall) и добавляет улучшенный исполнительный механизм, поддержку шейдинга с переменной скоростью и трассировку лучей, чего абсолютно достаточно для Arm, чтобы рассмотреть дизайн 4-го поколения Valhall.
Хотя максимальное количество шейдерных ядер остается равным 16, Immortalis-G715 имеет более высокий стандарт входа, поскольку самая базовая версия имеет 10 ядер по сравнению с семью на Mali-G710.
Новый исполнительный движок на первый взгляд очень похож на Mali-G710 . Основное изменение Arm заключается в перестройке процессорного блока, чтобы обеспечить удвоение возможностей FMA (плавное умножение-сложение) на процессор, а также управление памятью.
Чистым результатом, по нашему мнению, является 25-процентное увеличение площади кристалла, что удваивает производительность FMA. Эта стратегия умело придерживается философии Arm о добавлении кремния только в том случае, если выгода превышает физические затраты на внедрение.
Затенение с переменной скоростью уже некоторое время наблюдается на графических процессорах для настольных ПК, и оно работает за счет уменьшения количества фактического затенения, необходимого в областях одноблочной окраски — например, стены или неба — где вычисления выполняются попиксельно. пиксельная основа не нужна. Снижая скорость затенения с 1:1 до, скажем, 1:4, точность изображения, по крайней мере, для невооруженного глаза, сохраняется, хотя графический процессор выполняет меньше работы.
Как правило, хорошо реализованное затенение с переменной скоростью увеличивает частоту кадров до 30 процентов без какой-либо очевидной потери IQ.
Трассировка лучей в мобильных устройствах
Оставив самое важное объявление напоследок, Immortalis-G715 содержит специальное оборудование для трассировки лучей для точного расчета освещения и, с точки зрения компьютерной графики, окончательного цвета отображаемого пикселя. Конечно, те же вычисления можно выполнить и в программном обеспечении, но это ужасно неэффективно с точки зрения ресурсов, и Arm заявляет о 300-процентном ускорении за счет использования аппаратного обеспечения.
Стратегия Arm, по-видимому, аналогична тому, как настольные графические процессоры от Nvidia и AMD занимаются одним и тем же делом, то есть с использованием тестов ограничивающей рамки и пересечения треугольников, чтобы определить, есть ли попадание луча — это означает, что цвет луча света изменится в зависимости от того, что происходит. полет. Если это так, расчет отправляется в основные подразделения.
Обнуление только прослеживаемых лучей, а не тестирование каждого отдельного треугольника, значительно снижает общую сложность вычислений. Областью осторожности является производительность. Поскольку только четыре процента ядра шейдера посвящены трассировке лучей, мы удивляемся эффективности подхода Arm в мобильных играх с тяжелым RT. Если вы не создадите его, они не будут кодировать для RT… кажется, это мантра Arm.
Говорят, что помимо улучшений функций Immortalis-G715 предлагает около 15% производительности растеризации или на 15% больше эффективности, чем прошлогодний чемпион Mali-G710.
Arm также анонсирует сегодня графические процессоры Mali-G715 и Mali-G615 и отмечает отсутствие бренда Immortalis для этих двух. Обладая тем же шейдингом с переменной скоростью и механизмом исполнения FMA, что и Immortalis-G715, было бы разумным не включать оборудование для трассировки лучей по причинам производительности, упомянутым выше.
Понимание того, что эти два графических процессора, вероятно, будут премиальными в следующем году, а не флагманскими SoC, иметь от семи до девяти шейдерных ядер на Mali-G715 — хороший шаг; Mali-G615 справляется с шестью или меньше.
Сворачивать
Неотъемлемая часть комплексных вычислительных решений Arm, флагманские анонсы этого года в начале следующего года, отдают предпочтение комбинации процессоров Cortex-X3 , Cortex-A715/Cortex-A510 в сочетании с графикой Immortalis-G715. Общая платформа, созданная как сердцевина мобильных SoC, должна предлагать на 20-30% больше функций, а в графическом процессоре — ряд новых функций.
В начале 2023 года обратите внимание на флагманские смартфоны с новейшими технологиями Arm. Хотя это и не было объявлено по очевидным причинам, Dimensity следующего поколения от MediaTek, скорее всего, возьмет на себя большую часть передовой интеллектуальной собственности Arm.
Дорожная карта Arm продолжает наполнять SoC процессорами — как мощными, так и энергоэффективными — и графическими процессорами следующего поколения, основанными на функциях Immortalis. Удивитесь ли вы, увидев примерно в это же время в следующем году Arm Cortex-X4, Cortex-A725, Cortex-A520 и Immortalis-G725? Посмотрим, насколько мы правы.