Поиск по сайту:
Кто не понимает ничего, кроме химии, тот и ее понимает недостаточно (Г. Лихтенберг).

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

14.12.2022
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Появление GeForce RTX 4090 знаменует собой новую эру компьютерных игр, в которой традиционная производительность грубой силы сочетается с перспективной архитектурой, обеспечивая захватывающую дух графику с трассировкой лучей и плавный игровой процесс.
Нам потребовалось три поколения видеокарт RTX, чтобы мы могли с уверенностью заявить, что амбиции Nvidia были реализованы, но здесь мы довольны достигнутым прогрессом. Заметьте, так было не всегда, и за последние четыре года многое изменилось.

Еще в 2018 году RTX 20 Series можно было считать рискованным шагом. Резервирование важного места на кристалле для ядер RT и Tensor было неожиданным, а реальные последствия для геймеров были в лучшем случае туманными. Эй, хотите улучшить производительность в пользу лучших отражений в нескольких избранных играх? Аргумент в пользу трассировки лучей был далеко не ясен, но лидерство Nvidia в чистой растеризации было таким, что она могла рискнуть, не уступая первое место.

Перенесемся в серию GeForce RTX 30 2020 года, и ситуация начала меняться. Графика с трассировкой лучей продемонстрировала признаки того, что это первоначальное обещание оправдалось, падение производительности на обновленной архитектуре оказалось менее значительным, а с развитием DLSS оптимизация с улучшенным ИИ проложила путь к более высокой частоте кадров. Были заложены прочные основы, и Nvidia RTX свидетельствует о том, что и AMD, и Intel теперь рассматривают технологию трассировки лучей и масштабирования как краеугольный камень текущих и будущих графических процессоров.

Хорошо реализованная стратегия отражена в уверенных планах Nvidia по выпуску RTX 40 Series в 2022 году. По общему мнению, новые графические процессоры могли появиться раньше, если бы не избыточный запас деталей последнего поколения, а потенциал архитектуры Ады Лавлейс таков, что Nvidia была более чем счастлива приоткрыть завесу над производительностью, спецификациями и ценовыми неделями . перед запуском. Производитель в уверенном настроении.

 

Строительный блок AD102

Те из вас, кто жаждет результатов тестов, могут пропустить вперед — они удивительны во многих отношениях — но для гиков среди нас давайте начнем со всего, что происходит под капотом RTX 40 Series.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Вся мощь архитектуры RTX третьего поколения под кодовым названием Ada Lovelace визуализируется как графический процессор AD102. Это нечто, не так ли?

То, что вы видите, — это один из самых сложных потребительских графических процессоров на сегодняшний день. Кристалл Nvidia площадью 608 мм2 , изготовленный по технологии TSMC 4N, содержит невероятные 76,3 миллиарда транзисторов. Если представить эту цифру в перспективе, лучший чип GeForce предыдущего 8-нм поколения, GA102, имеет размеры 628 мм 2 , но вмещает жалкие 28,3 миллиарда транзисторов. Nvidia одним махом перескочила на два узла, поскольку 8-нм техпроцесс Samsung больше похож на 10-нм техпроцесс других литейных производителей.

Мы прошли путь от легковеса до тяжеловеса за одно поколение, и 170-процентное увеличение количества транзисторов, естественно, является хорошим предзнаменованием для спецификаций. Полноразмерный кристалл содержит 12 кластеров обработки графики (GPC), каждый из которых содержит дюжину потоковых мультипроцессоров (SM), шесть кластеров обработки текстур (TPC) и 16 блоков вывода рендеринга (ROP). Приступая к подробностям блок-схемы, каждый SM содержит 128 ядер CUDA, четыре ядра Tensor, одно ядро ​​RT и четыре блока текстур.

В целом, Ada представляет собой ошеломляющие 18 432 ядра CUDA в самой истинной форме, что составляет более чем 70-процентное увеличение по сравнению с чемпионом последнего поколения, RTX 3090 Ti. Много обещаний, но, к разочарованию любителей производительности, Nvidia предпочитает не раскрывать всю мощь Ады в этой первой волне. Первоначальное трио графических процессоров выглядит следующим образом:

GeForceRTX 4090RTX 4080
16 ГБ
RTX 4080
12 ГБ
RTX 3090 TiRTX 3080 TiRTX 3080
12 ГБ
Дата запускаокт 2022ноябрь 2022 г.ноябрь 2022 г.март 2022 г.июнь 2021 г.Январь 2022 г.
Кодовое названиеAD102AD103AD104GA102GA102GA102
АрхитектураAda LovelaceAda LovelaceAda LovelaceAmpereAmpereAmpere
Процесс (нм)444888
Транзисторы (млрд.)76,345,935,828,328,328,3
Размер матрицы (мм 2 )608,5378,6294,5628,4628,4628,4
Смс128 из 14476 из 8060 из 6084 из 8480 из 8470 из 84
CUDA-ядра16 3849728768010 75210 2408960
Тактовая частота (МГц)252025052610186016651710
Пик FP32 TFLOPS82,648,740,140,034,130,6
Ядра РТ1287660848070
RT TFLOPS191,0112,792,778,166,659,9
Тензорные ядра512304240336320280
ROP1761128011211296
Текстурные блоки512304240336320280
Объем памяти (ГБ)241612241212
Тип памятиGDDR6XGDDR6XGDDR6XGDDR6XGDDR6XGDDR6X
Шина памяти (бит)384256192384384384
Часы памяти (Гбит/с)2122,421211919
Пропускная способность (ГБ/с)10087175041008912912
Кэш L1 (МБ)169,57,510,5108,8
Кэш L2 (МБ)726448666
Мощность (Вт)450320285450350350
Стартовая рекомендованная розничная цена ($)1599119989919991199799

 

Оставляя место для легендарной RTX 4090 Ti, первая RTX 4090 отключает один GPC, позволяя использовать 128 из 144 возможных SM. Результирующие цифры в 16 384 ядра CUDA, 128 ядер RT и 512 ядер Tensor остаются высокими по сравнению с ними, а запас по частоте для 4-нм техпроцесса чрезвычайно впечатляет: Nvidia указывает тактовую частоту 2,5 ГГц для флагманского продукта. От вашего внимания не ускользнуло, что пиковые терафлопы выросли более чем в два раза, с 40 на RTX 3090 Ti до 82,6 на RTX 4090.

Читать  Конвейер инструкций и опасности

Мысль о RTX 4090 Ti за 1999 долларов, ожидающей своего часа, вызовет раздражение у стойких геймеров, желающих получить самое лучшее в первый же день, однако, если вы являетесь сторонником PCMR, порадуйтесь тому факту, что Xbox Series X производит всего 12,1 терафлопс. PlayStation 5, спросите вы? Пфффф, всего 10,3 терафлопс.

МЫСЛЬ О RTX 4090 TI ЗА 1999 ДОЛЛАРОВ, ОЖИДАЮЩЕЙ СВОЕГО ЧАСА, ВЫЗОВЕТ РАЗДРАЖЕНИЕ У СТОЙКИХ ГЕЙМЕРОВ

 

Внешние характеристики RTX 40 Series открывают глаза, но задняя часть заметно менее революционна, где знакомые 24 ГБ памяти GDDR6X работают со скоростью 21 Гбит/с, обеспечивая пропускную способность 1008 ГБ/с. Стрелка не сдвинулась с места — Nvidia предпочла более быстрые чипы Micron со скоростью 24 Гбит/с — однако нагрузка на память снизилась благодаря значительному увеличению кэш-памяти на кристалле.

RTX 4090 несет 16 МБ L1 и 72 МБ L2. Ранее мы видели, как AMD подключала до 128 МБ Infinity Cache к графическим картам Radeon, и, хотя Nvidia не детализирует скорость передачи данных или тактовые циклы, более чем 5-кратное увеличение кэш-памяти между поколениями снижает необходимость рутинной буферизации в память. повышение производительности и сокращение задержки.

Слышали слухи о том, что для работы серии RTX 40 требуется ядерный реактор? Такие отчеты не соответствуют действительности. RTX 4090 поддерживает те же 450 Вт TGP, что и RTX 3090 Ti, в то время как решения Ada Lovelace второго и третьего уровня масштабируются до 285 Вт. 450 Вт по-прежнему имеет большое значение, и те, кто знаком с блоком графического процессора, помнят, что 250 Вт еще не так давно считались верхним пределом. Однако, в отличие от RTX 3090 Ti, мощность RTX 4090 такова, что производительность на ватт значительно выше; нам обещают удвоить производительность при том же бюджете мощности, что и в предыдущем поколении.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Что касается других графических процессоров Ады Лавлейс, RTX 4080 16 ГБ и вызывающая споры RTX 4080 12 ГБ должны появиться в ноябре. Более дорогой из двух снова не соответствует полной реализации с 76 из 80 возможных SM. Разногласия возникают из-за того, что в обеих моделях используется уникальная матрица; AD103 для карты на 16 ГБ и AD104 для карты на 12 ГБ.

Обыкновенных геймеров, ориентирующихся исключительно на бренд, можно обмануть, думая, что обе модели имеют в целом схожие характеристики, но различия между ними очень глубоки: AD104 уменьшает количество ядер с 9728 до 7680. Ядра RT и Tensor сокращаются пропорционально, а ширина шины памяти урезается до 192 бит.

Распространено мнение, что RTX 4080 12 ГБ следовало бы назвать RTX 4070, так зачем рисковать? Официальная позиция Nvidia заключается в том, что графический процессор третьего уровня настолько быстр, что заслуживает маркировки класса 80. Этот аргумент подкрепляется тем, что пиковые терафлопсы находятся на одном уровне с RTX 3090 Ti, но более логичной причиной является цена. В конце концов, для RTX 4080 гораздо проще иметь цену в 899 долларов, чем для RTX 4070, и в интересах акционеров 294,5-мм 2 GPU по цене 899 долларов выглядит чрезвычайно красиво по сравнению с 628,4-мм 2 , Предшественник за 799 долларов.

РАСПРОСТРАНЕНО МНЕНИЕ, ЧТО RTX 4080 12 ГБ СЛЕДОВАЛО БЫ НАЗВАТЬ RTX 4070, ТАК ЗАЧЕМ РИСКОВАТЬ?

 

Nvidia была в игре достаточно долго, чтобы знать, что графические процессоры нужно массировать, чтобы достичь разных ценовых категорий, и с Адой Лавлейс есть много места для маневра. Не удивляйтесь, увидев полноценные RTX 4090 Ti и RTX 4080 Ti дальше по линейке, и когда RTX 4070 в конечном итоге материализуется, она вполне может принять форму урезанного AD104.

Надев нашу гипотезу, отключение всего AD104 GPC теоретически оставит RTX 4070 с 6144 ядрами CUDA и производительностью 32 терафлопс. Потенциальная замена долгожданной RTX 3080 10 ГБ за 699 ​​долларов?

Цены в конечном итоге будут по-прежнему раздражать пользователей ПК, которые чувствуют себя выжатыми из высокопроизводительных игр, и хотя на этот раз мало шансов на спрос, подпитываемый майнингом, рыночные условия и безудержная инфляция не способствуют сделкам с высокопроизводительными графическими процессорами. Хотя мы надеемся, что Intel Arc и AMD RDNA3 восстановят конкуренцию в среднем ценовом сегменте (например, RTX 4080 12 ГБ), мы не ожидаем каких-либо серьезных соперников RTX 4090.

Помимо основных спецификаций, стоит знать, что выходы дисплея по-прежнему привязаны к HDMI 2.1 и DisplayPort 1.4a — DisplayPort 2.0 не прошел отбор — и PCIe Gen 4 остается предпочтительным интерфейсом. По словам Nvidia, нет необходимости срочно переходить на Gen 5, поскольку даже RTX 4090 не может насытить старый стандарт. Наконец, NVLink бросается в глаза своим отсутствием; SLI нигде не видно ни в одном продукте серии RTX 40, анонсированном до сих пор, сигнализируя о том, что установки с несколькими графическими процессорами действительно мертвы.

Читать  Dell Precision 5550 - самая тонкая рабочая станция

 

Ада-оптимизация

В то время как переход к меньшему узлу обеспечивает большую огневую мощь транзистора, такой переход обычно исключает радикальные изменения в архитектуре. Оптимизация и находчивость — на повестке дня, а огромные вычислительные потребности трассировки лучей таковы, что сырой мощности, полученной за счет трехкратного увеличения бюджета транзисторов, недостаточно; нужно что-то еще, и Ада Лавлейс предлагает несколько изящных трюков.

Nvidia часто называет трассировку лучей относительно новой технологией, подчеркивая, что старая добрая растеризация подвергалась волне за волной оптимизации, и такое усовершенствование активно разрабатывается для ядер RT и Tensor. Там, где низко висящие плоды еще предстоит собрать, есть много возможностей.

Изменение порядка выполнения шейдеров

Шейдеры эффективно работают уже много лет, когда одна инструкция выполняется параллельно в нескольких потоках. Вы можете знать это как SIMT.

Трассировка лучей, однако, бросает гаечный ключ в эти гладкие работы, так как в то время как пиксели в растеризованном треугольнике поддаются одновременной работе, удерживая все полосы занятыми, вторичные лучи расходятся по своей природе, а метод обреза, поражающий разные области сцены, приводит к массивным неэффективность из-за неработающих полос.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Исправление Ады, получившее название Shader Execution Reordering (SER), представляет собой новый этап в конвейере трассировки лучей, задача которого заключается в сканировании отдельных лучей на лету и группировании их вместе. Результат, судя по внутренним цифрам Nvidia, — двукратное улучшение производительности трассировки лучей в сценах с высоким уровнем расхождения.

Nvidia знаменательно заявляет, что SER — это «такая же большая инновация, как неупорядоченное выполнение для процессоров». Смелое заявление, и есть оговорка, что переупорядочивание выполнения шейдеров является расширением API-интерфейсов DXR от Microsoft, а это означает, что разработчики должны внедрять и оптимизировать SER в играх.

Нет ничего плохого в том, чтобы иметь инструменты и разум, и Nvidia быстро обнаруживает, что то, что работает для растеризации, очевидно, может работать и для RT.

 

Модернизированные ядра RT

В мире растеризации узкие места в геометрии устраняются с помощью шейдеров сетки. В том же духе смещенные микросетки призваны отразить такие улучшения в трассировке лучей.

ЭПОХА ГРУБОЙ СИЛЫ РЕНДЕРИНГА ГРАФИКИ ЗАКОНЧИЛАСЬ

Брайан Катандзаро, вице-президент Nvidia по прикладным исследованиям глубокого обучения

 

В Ampere иерархия ограничивающих объемов (BVH) была вынуждена содержать каждый отдельный треугольник в сцене, готовый к семплированию ядром RT. Ада, напротив, может оценивать сетки в ядре RT, идентифицируя базовый треугольник до тесселяции, чтобы резко сократить требования к хранилищу.

Меньший сжатый BVH может обеспечить большую детализацию в сценах с трассировкой лучей с меньшим воздействием на память. При необходимости вставлять только базовые треугольники время сборки BVH сокращается на порядок, а размеры данных значительно уменьшаются, что помогает снизить нагрузку на ЦП.

Явная сложность трассировки лучей такова, что устранение ненужной работы с шейдерами как никогда важно. С этой целью в ядро ​​​​Ada RT также был добавлен механизм микрокарты Opacity, чтобы уменьшить объем информации, передаваемой туда и обратно шейдерам.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

В обычном примере с листом разработчики размещают текстуру листвы внутри прямоугольника и используют непрозрачные полигоны для определения положения листа. Способ эффективного построения целых деревьев, но с Ampere ядру RT не хватало этой базовой возможности, когда все лучи возвращались обратно в шейдер, чтобы определить, какие области являются непрозрачными, прозрачными или неизвестными. Механизм Ada Opacity Micromap Engine может идентифицировать все непрозрачные и прозрачные полигоны без вызова какого-либо кода шейдера, что приводит к двукратному увеличению производительности альфа-обхода в некоторых приложениях.

Эти два новых аппаратных блока делают ядро ​​RT третьего поколения более производительным, чем когда-либо прежде — TFLOPS на ядро ​​RT выросло примерно на 65% между поколениями — но всего этого недостаточно, чтобы подтвердить заявления Nvidia о том, что Ада Лавлейс обеспечивает до В 4 раза выше производительность предыдущего поколения. Для этого Team Green продолжает полагаться на ИИ.

 

DLSS 3

С 2019 года Deep Learning Super Sampling играет жизненно важную роль в разработке графических процессоров GeForce. Приверженность Nvidia этой технологии лучше всего выразил Брайан Катандзаро, вице-президент по прикладным исследованиям в области глубокого обучения, который недвусмысленно заявляет, что «эра рендеринга графики грубой силы закончилась».

DLSS третьего поколения, считающаяся «полной революцией в нейронной графике», расширяет масштабирование DLSS Super Resolution, обученное искусственным интеллектом, используя оценку оптического потока для создания целых кадров. Nvidia считает, что благодаря сочетанию DLSS Super Resolution и DLSS Frame Generation DLSS 3 теперь может реконструировать семь восьмых от общего числа отображаемых пикселей игры, что значительно повышает производительность и плавность.

Генерация такого большого количества контента на экране без вызова конвейера шейдеров была бы немыслима всего несколько лет назад. Это замечательное изменение направления, но эти волшебные дополнительные кадры не появляются из воздуха. DLSS 3 использует четыре входа — два последовательных внутриигровых кадра, поле оптического потока и данные движка, такие как векторы движения и буферы глубины, — для создания и вставки синтезированных кадров между рабочими кадрами.

Чтобы получить необходимую информацию, ускоритель оптического потока Ada способен работать с оптическим потоком до 300 TeraOPS (TOPS), и это двукратное увеличение скорости по сравнению с Ampere считается жизненно важным для создания точных кадров без артефактов.

Читать  Новый маркетинг — купите GeForce RTX 4090 и получите бесплатную видеокарту Intel Arc A750
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Реальные преимущества кадров, сгенерированных ИИ, наиболее остро ощущаются в играх, привязанных к процессору, где DLSS Super Resolution обычно мало чем может помочь. Предпочтительным примером Nvidia является Microsoft Flight Simulator, чьи большие расстояния прорисовки неизбежно приводят к узкому месту процессора. Внутренние данные показывают, что DLSS 3 Frame Generation может повысить производительность Flight Sim в 2 раза.

Также обратите внимание, что генерация кадров и суперразрешение могут быть реализованы разработчиками независимо друг от друга. В идеальном мире у геймеров будет возможность включать и выключать первое, а второе — с помощью выбора настроек качества.

Более требовательные рабочие нагрузки искусственного интеллекта, естественно, требуют более быстрых тензорных ядер, и Ada обязуется, внедряя Transformer Engine FP8 из Hopper, оптимизированного для высокопроизводительных вычислений. Пиковая производительность FP16 Tensor терафлопс уже удвоена с 320 на Ampere до 661 на Ada, но с добавленной поддержкой FP8 RTX 4090 может обеспечить теоретически 1,3 петафлопс обработки Tensor.

Много напыщенности, но не приведет ли такая обработка к нежелательному увеличению задержки? Такие опасения искренни; Nvidia приняла решение сделать Reflex обязательным требованием для реализации DLSS 3.

Разработанный для обхода традиционной очереди рендеринга, Reflex синхронизирует рабочие нагрузки ЦП и ГП для оптимального отклика и двукратного сокращения задержки. Оптимизация Ada и, в частности, Reflex играют ключевую роль в снижении задержки DLSS 3 до уровня DLSS 2, но, как и во многих других аспектах, связанных с DLSS, успех зависит от предположения, что разработчики смогут пройти через соответствующие обручи. В этом случае в код должны быть добавлены маркеры Reflex, позволяющие игровому движку возвращать данные, необходимые для координации как ЦП, так и ГП.

Учитывая то, что разработка игр для ПК зачастую находится в затруднительном состоянии, геймеры правы в том, что они должны быть осторожны, когда ответственность возлагается на разработчиков, и есть еще одна оговорка в том, что технология DLSS становится все более фрагментированной между поколениями.

DLSS 3 теперь представляет собой расширенный набор трех основных технологий: генерация кадров (только для серии RTX 40), суперразрешение (серии RTX 20/30/40) и Reflex (любой графический процессор GeForce, начиная с серии 900). Nvidia не планирует в ближайшее время переносить генерацию кадров на более медленные карты Ampere.

 

NVENC 8 -го поколения

И последнее, но не менее важное: Ада Лавлейс поступила мудро, не упустив из виду растущую популярность потоковой передачи игр как во время, так и после пандемии.

Опираясь на поддержку Ampere декодирования AV1, Ada добавляет аппаратное кодирование, повышая эффективность H.264 на 40 процентов. По словам Nvidia, это позволяет стримерам увеличить разрешение потока до 1440p при сохранении того же битрейта.

Поддержка AV1 также является хорошим предзнаменованием для профессиональных приложений — DaVinci Resolve одной из первых объявила о совместимости — и Nvidia расширяет этот потенциал на высокопроизводительных графических процессорах серии RTX 40, гарантируя, что все три запускаемые модели включают в себя два кодировщика NVENC 8 -го поколения (позволяющие захватывать 8K60 и Экспорт в 2 раза быстрее), а также декодер NVDEC 5 -го поколения в стандартной комплектации.

 

Улучшенное издание для основателей

Многое было сделано из отношений Nvidia с производителями дополнительных плат. В связи с тем, что последние несколько поколений аппаратного обеспечения GeForce делали упор на собственные видеокарты Founders Edition, в прошлом месяце разразился ропот недовольных партнеров, когда давний партнер EVGA объявил, что не будет производить видеокарты серии RTX 40.

Последствия, казалось бы, ожесточенного спора остаются неясными, но одно можно сказать наверняка: Nvidia не собирается отвлекать внимание от своих собственных продуктов. Партнеры почти не упоминались на брифингах компании для прессы, а решение запустить обзоры Founders Edition за день до выпуска карт AIB заставило производителей играть на втором месте.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Какую бы карту вы ни выбрали, она будет большой. Многое было сделано из шаткого дизайна RTX 4090, но, пока мы наслаждаемся мемами, фактические размеры Founders Edition предполагают, что между поколениями мало что изменилось.

Уже большая RTX 3090 проложила путь для трехслотовых плат Founders Edition, но не достигла полной трехслотовой толщины (если быть точным, 2,7 слота). RTX 4090 идет полным ходом с форм-фактором 3,0 слота, что делает его немного толще, хотя длина, вы можете быть удивлены, укорочена с 313 мм до 304 мм. Это уменьшение, наряду с тонким изгибом на внешней стороне, делает карту более пухлой, чем предполагают ее размеры.

Ставя свою шею на карту, я ничего не имею против видеокарт большего размера. На самом деле, мы часто предполагали, что слабеющая поддержка SLI должна позволить AIB производить более компактные карты в пользу более низких температур и более тихой акустики. Именно по этим причинам нам понравились кулеры Asus Noctua Edition с 4,3 слотами.

Обновленный кулер Founders Edition от Nvidia, применимый как к RTX 4090, так и к RTX 4080 16 ГБ (RTX 4080 12 ГБ будет доступен только в дизайнах партнеров), использует преимущества более широкой талии за счет включения новой испарительной камеры, улучшенной конфигурации тепловых трубок, более крупных вентиляторов, рекламирующих 20 процентное увеличение воздушного потока и особое внимание к охлаждению памяти.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Известно, что GDDR6X сильно нагревалась на картах последнего поколения, и Nvidia решила эту проблему двумя способами. Во-первых, чипы Micron теперь построены на меньшем и более эффективном узле. Во-вторых, повышенная плотность позволяет разместить всю память на одной стороне печатной платы для более эффективного охлаждения. Насколько эффективно? Nvidia заявляет о снижении температуры GDDR6X на 10°C во время игр.

Миниатюрная печатная плата Nvidia, форма которой оптимизирована для воздушного потока, содержит два дополнительных слоя для повышения эффективности, а количество фаз питания графического процессора увеличено с 16 до 20. Наиболее заметная очистка происходит в правом верхнем углу, где заменено несколько разъемов питания PCIe. с помощью одного перспективного блока питания 12VHPWR, обеспечивающего совместимость с блоками питания ATX 3.0.

Не спешите отказываться от имеющегося блока питания? Адаптеры прилагаются ко всем картам RTX 4090, преобразуя три или четыре восьмиконтактных разъема PCIe в стандарт 12VHPWR. Конечным результатом является беспорядочное расположение кабелей, и любой, кто планирует ультратонкую сборку, захочет использовать блок питания ATX 3.0. Тем не менее, у нас не было проблем с запуском карт RTX 4090 на нашем надежном be quiet! блок питания Straight Power 11 Platinum мощностью 1000 Вт, и обратите внимание, что обязательными являются только три разъема PCIe; четвертый, потребляющий мощность от 450 Вт до 600 Вт, оправдан только в том случае, если вы склонны разгонять новый блестящий графический процессор.

 

Palit GameRock OC

Каким бы впечатляющим ни был Founders Edition, для тех, кто ищет что-то еще большее и смелое, доступны варианты с нестандартным охлаждением. Есть буквально десятки на выбор , и Palit бросается в глаза с GameRock OC.

Как правило, партнеры склонны раздувать эталонный дизайн. Теперь, когда Nvidia использует полные три слота, карты AIB свободно размещаются в четвертом или даже пятом отсеке. Официально обозначенный дизайн с 3,5 слотами, бегемот Palit имеет размеры 329,4 мм x 137,5 мм x 71,5 мм и весит 1984 г.

Это, без сомнения, монстр, и огромные карты быстро стали обычным явлением в 2022 году. Собственная RTX 3090 Ti от Palit не стала фиолетовой, а размеры не слишком отличаются от массивной Radeon RX 6950 XT от Sapphire.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

С радиаторами таких размеров у партнеров AIB не должно возникнуть проблем даже с графическим процессором мощностью 450 Вт. Palit использует испарительную камеру в сердце своего зверя вместе с тремя поклонниками «охотников за штормами». Все три выключаются при низкой нагрузке, что хорошо, но слишком резко раскручиваются от нуля до 30%, когда температура превышает 50°C. Вентиляторы остаются достаточно тихими во время игр, однако переход от выключения к включению мог бы быть более плавным.

Отдельный разъем питания 12VHPWR можно использовать с изображенным четырехконтактным адаптером на существующих блоках питания, и интересно отметить, что рекомендации Palit по источникам питания более надежны, чем большинство других. В то время как Nvidia предлагает 850 Вт для систем с Founders Edition, Palit рекомендует поразительные 1200 Вт доступного сока. Это ошибка крайней осторожности; карта едва справляется с нашим блоком питания на 1000 Вт.

Модернизированная цельнометаллическая задняя панель обеспечивает необходимую жесткость, а в комплект поставки Palit входит адресный RGB-кабель для синхронизации материнской платы, а также полезный опорный кронштейн. Последний крепится к монтажным отверстиям на конце карты и может регулироваться по высоте с помощью набора стержней. Это простое, но эффективное дополнение, резиновая ножка которого предотвращает появление царапин или повреждений корпуса.

Незначительный заводской разгон представлен в тактовой частоте 2610 МГц — по сравнению с 2520 МГц на FE — но настоящая причина рассмотреть Palit — это огромное количество яркой RGB-подсветки. Подсвеченные логотипы в верхней части рассказывают только половину истории, а дизайн «звездный черный кристалл» на передней панели — это то, в чем действительно заключается привлекательность.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Сердце настроено на сборку, которая затмит вашу рождественскую елку в этот праздничный сезон? Относительно пресное Founders Edition просто не подойдет. С другой стороны, кристаллизованная фасция Palit оживляет буровую установку. Эффект освещения на самом деле работает довольно хорошо в традиционной горизонтальной компоновке — количество света хорошо отражается в нашем корпусе Fractal Design Define R6 — но карта гарантированно привлечет внимание в вертикальной ориентации.

Правда, некоторые эффекты не идеальны — не хватает светодиодов, чтобы переходы казались плавными, — но Palit получает высшую оценку за попытку выделиться из толпы. Знак вопроса, который остается, касается цены. Стоимость Founders Edition от Nvidia здесь, на британских берегах, составляет 1679 фунтов стерлингов, и мы считаем, что партнерские карты с воздушным охлаждением должны быть как можно ближе к отметке в 1700 фунтов стерлингов. Это может быть сложно, учитывая резкое падение курса фунта стерлингов, но в наших обсуждениях с Palit нам сказали, что карты с нестандартным охлаждением, как ожидается, будут стоить примерно от 1675 фунтов стерлингов для моделей начального уровня и до 1730 фунтов стерлингов для таких моделей, как GameRock. ОС.

Мы уже достаточно долго болтали, как насчет тестов?

 

Производительность

Совершенно новую архитектуру необходимо протестировать с нуля. Все наши сравнительные графические процессоры тестируются с нуля на нашей надежной тестовой платформе Ryzen 9 5950X. Материнская плата Asus ROG Crosshair VIII Formula была обновлена ​​до последней версии BIOS 4201, Windows 11 — до версии 22H2, и на момент написания мы использовали самые последние драйверы Nvidia и AMD.

Обычно мы пользуемся этой возможностью, чтобы указать на релевантные сравнения, на которые стоит обратить внимание. Их нет; RTX 4090 стоит особняком.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Да, сэр, Ада довольно быстрая. 55-процентный прирост по сравнению с RTX 3090 Ti не вызывает насмешек — оценка совпадает с 52-процентным увеличением ядер CUDA — но что-то не так. Учитывая архитектурные усовершенствования, мы ожидаем, что RTX 4090 преодолеет отметку в 30 тыс. км в стандартном тесте 3DMark Time Spy.

Дальнейшее расследование открывает удивительную правду; RTX 4090 настолько быстр, что Ryzen 9 5950X просто не поспевает за ним. Наша надежная тестовая платформа хорошо служила нам в течение многих лет, но, похоже, пришло время перейти на что-то более быстрое.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Мы не ожидаем, что какая-либо партнерская карта не сможет пройти 97-процентное требование в стресс-тесте 3DMark. Последней картой, которая вышла из строя, действительно была GeForce RTX 3080 Ti Founders Edition от Nvidia.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Более быстрые ядра RT… и многое другое. Тест 3DMark DirectX Raytracing показывает более чем двукратный скачок в производительности поколения.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Вы знаете, что видеокарта работает быстро, когда результаты заставляют вас изменить максимальные границы оси.

 

Assassin’s Creed Valhalla

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Когда дело доходит до реальных игр, было обнаружено, что Palit RTX 4090 GameRock OC работает на частоте ~ 2,8 ГГц во время реального использования на нашей полностью построенной тестовой платформе. Такая мощность графического процессора заслуживает панели с высоким разрешением и высокой частотой обновления. QHD с частотой более 200 Гц было бы неплохо, но все чаще кажется, что 4K120 является целью всей отрасли.

 

Cyberpunk 2077

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Cyberpunk 2077 — это современный аналог Crysis, разрушитель слабых графических процессоров. Теперь у нас есть более 80 кадров в секунду в QHD с трассировкой лучей, установленной на ультра. Однако 4K60 остается вне досягаемости 4090. DLSS, как вы могли догадаться, будет что сказать об этом чуть позже в нашем тестировании.

 

Far Cry 6

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

В Far Cry 6 есть узкое место или предел частоты кадров. RTX 4090 комфортно возглавляет график с 4K, но даже более старые графические процессоры могут обеспечить 4K60 в этой игре с трассировкой лучей.

 

Final Fantasy XIV: Endwalker

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Final Fantasy XIV: Endwalker обычно является хорошим признаком возможностей растеризации графического процессора. RTX 4090 оказалась на 42% быстрее, чем RTX 3090 Ti. Быстро, но можно ли было ожидать большего от 76,6 миллиардов транзисторов?

 

Forza Horizon 5

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Красивый гонщик от Playground Games дает захватывающее представление. Вам может быть интересно, почему в FHD или QHD не указан минимальный FPS. Причина в том, что заявленный минимум графического процессора выше, чем средний показатель в игре; и снова наша тестовая платформа Ryzen 9 5950X не может угнаться за скоротечной GeForce. Это узкое место устраняется при разрешении 4K, где RTX 4090 сохраняет 50-процентное преимущество перед RTX 3090 Ti.

 

Стражи Галактики Марвел

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Добавьте к этому трассировку лучей, и разрыв в производительности между поколениями значительно увеличится. От 59 до 99 кадров в секунду при 4K — это не что иное, как поразительно, и вам понадобится монитор с высоким разрешением для RTX 4090, чтобы размять ноги. Ценность такой огневой мощи снижается в разрешении 1080p.

 

Tom Clancy’s Rainbow Six Extraction

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Nvidia неоднократно заявляла о желании подтолкнуть геймеров к выходу за рамки 1080p. Вездесущее разрешение Full HD остается опорой в профессиональном игровом пространстве, где участники жаждут сверхвысокой частоты обновления. Пришло ли время 1440p стать стандартом? Для тех, кто может позволить себе самый лучший GPU, возможно, да.

Если вы каким-то образом все еще сомневаетесь в производительности, взгляните еще раз на графики Rainbow Six и обратите внимание, что минимальная частота кадров RTX 4090 выше, чем в среднем у любой другой карты. Помешанные.

 

Эффективность, температура и шум

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Энергопотребление Ады Лавлейс в последние месяцы стало предметом интенсивных спекуляций. В то время как 450 Вт находится на верхнем уровне шкалы графического процессора, конфигурация RTX 4090 такова, что реальное энергопотребление часто ниже, чем вы думаете.

Вся наша тестовая система в большинстве игр потребляла менее 550 Вт; только в самых требовательных играх с трассировкой лучей мы смогли приблизить этот показатель к наихудшему сценарию 595 Вт. Заметное улучшение по сравнению с RTX 3090 Ti, которая всегда была близка к пределу.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Лучший способ оценить эффективность — разделить среднюю частоту кадров 4K UHD во всех протестированных играх на пиковое общесистемное энергопотребление. Графические процессоры мощностью 450 Вт звучат не так уж привлекательно в эпоху пугающих затрат на электроэнергию, однако ни одна другая карта в нашей линейке не сравнится с RTX 4090 по производительности на ватт.

Стоит точно знать, какими могут быть ваши расходы в наши дни. Взяв в качестве примера нашу систему Ryzen 9 5950X/GeForce RTX 4090, мы подсчитали, что час игры в день будет стоить 74 фунта стерлингов в год на электроэнергию. Играйте по четыре часа в день, и вы получите счет в 246 фунтов стерлингов. Цифры основаны на предельной ставке цен на энергию в Великобритании в октябре в размере 34 пенсов за кВтч.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Неважно, укрощаете ли вы ЦП, ГП или простой твердотельный накопитель, более крупное охлаждающее устройство — верный способ обеспечить более низкие температуры. Учитывая частоты, на которых работает RTX 4090, температура ниже 70°C является подходящим охлаждением.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

Palit GameRock OC также снижает уровень шума до разумного уровня. Мы полагаем, что наиболее точно настроенные кулеры AIB будут работать еще лучше; Интересно, кто первым снизит уровень недогрузки ниже 35 дБ?

 

Разгон

На фронте разгона есть хорошие и плохие новости. Начнем с хорошего: RTX 4090, несмотря на высокие частоты доставки, имеет больший запас. Те, кто склонен повышать ставку с ручным вмешательством, получат скорость, близкую к 3 ГГц.

Ради здоровья нашей карты мы решили использовать автоматический сканер OC Afterburner, который все еще работает на Аде Лавлейс. С оперативной памятью, увеличенной до 23 Гбит/с, частота ядра в игре обычно проскакивала за пределы 2,9 ГГц.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!
Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Какие плохие новости? Что ж, разгон — рискованное времяпрепровождение на любом графическом процессоре, не говоря уже о том, что он стоит более 1600 фунтов стерлингов. Незначительные улучшения производительности компенсируются увеличением энергопотребления, и если вы действительно хотите повысить частоту кадров, значительный прирост доступен другими способами. Говоря о которых.

 

DLSS 3

Потратив последние несколько десятилетий на оценку графических процессоров в знакомой манере, отрадно наблюдать за кардинальными изменениями в том, как обеспечивается и оценивается производительность графики.

ГРОМОВАЯ РАСТЕРИЗАЦИЯ И МОЛНИЕНОСНЫЕ ЯДРА RT, НО DLSS 3 — ЭТО БУРЯ, КОТОРАЯ НАЗРЕВАЕТ

RTX 4090 может похвастаться молниеносной растеризацией и молниеносными ядрами RT, но DLSS 3 — это назревающий шторм. Перезагружая банки памяти после всех этих тестов, помните, что у разработчиков теперь есть возможность включить отдельные элементы управления для суперразрешения и/или генерации кадров. Первый, как вы, несомненно, знаете, повышает качество изображения в зависимости от настроек; Ultra Performance творит чудеса на рендеринге 1280×720, Performance — на 1920×1080, Balanced — на 2227×1253, а Quality повышается с 2560×1440.

Вдобавок ко всему, генерация кадров вставляет синтезированный кадр между двумя визуализируемыми, что приводит к множеству вариантов конфигурации. Хотите абсолютную максимальную частоту кадров? Переключите Super Resolution на Ultra Performance и включите Frame Generation, что приведет к повышению разрешения до 720p, из которого также синтезируются целые кадры.

Хотите избежать какого-либо масштабирования, но готовы жить с кадрами, созданными из рендеринга в полном разрешении? Затем отключите суперразрешение и включите генерацию кадров. Обратите внимание, что включение последнего автоматически вызывает Reflex; технология уменьшения задержки является обязательной, что еще раз подтверждает тот факт, что дополнительная обработка снижает производительность в других областях.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Рецензентам был предоставлен доступ к предварительным версиям избранных игр, использующих технологию DLSS 3. Первоначальные впечатления таковы, что разработчики все еще справляются с реализацией. Некоторые игры требуют, чтобы настройки были включены в определенной последовательности для правильного включения DLSS 3, в то время как другие просто аварийно завершают работу при возврате на рабочий стол с помощью Alt-Tab. Есть и другие ограничения. DLSS 3 в настоящее время не совместим с V-Sync (FreeSync и G-Sync в порядке), а генерация кадров работает только с DX12.

Дело в том, что, несмотря на то, что Nvidia считает, что освоение сильное — уже анонсировано около 35 игр DLSS 3 — это первые дни, и некоторые реализации будут работать лучше, чем другие. Cyberpunk 2077, ранее полный беспорядка, за несколько месяцев резко превратился в значительно улучшенную игру, которая лучше всего демонстрирует, на что способны трассировка лучей и DLSS.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Производительность оценивается при разрешении 4K UHD с трассировкой лучей Ultra и DLSS в восьми уникальных конфигурациях (мы не шутили, когда сказали, что у геймеров будет множество вариантов). Отдать все в руки растеризации, очевидно, недостаточно; 42 кадра в секунду – это плохо.

Включите генерацию кадров, при этом кадры синтезируются из собственного рендеринга 4K, а частота кадров увеличивается на 71%, что эквивалентно суперразрешению при максимальном качестве. Помимо этого, производительность масштабируется по мере ухудшения качества изображения. Максимальное суперразрешение (масштабирование до 1440p) с генерацией кадров увеличивает FPS до 112, а снижение качества Super Resolution до производительности (масштабирование до 1080p) приводит к частоте кадров до 146. Именно здесь заявления Nvidia о 4-кратном увеличении производительности становятся очевидными.

DLSS 3 работает, об этом свидетельствуют цифры, но здесь поднимается так много других вопросов. Сторонники производительности, естественно, будут сетовать на тот факт, что не все кадры должным образом растеризованы, и, хотя Nvidia считает, что разработчики на борту, вы должны задаться вопросом, как художники игр относятся к тому, что их творения искусственно объединены.

 

Многие ответы в конечном итоге связаны с тем, насколько хорошо DLSS поддерживает качество изображения. Плюсы и минусы суперразрешения хорошо задокументированы, но генерация кадров — это совершенно новый зверь, и даже на этом раннем этапе признаки хороши.

Скриншоты выше, показывающие синтезированный кадр между двумя рендерами, позволяют предположить, что ускоритель оптического потока Nvidia отлично справляется с задачей реконструкции кадра, хотя визуальные артефакты все же остаются. Элементы HUD, в частности, имеют тенденцию сбивать с толку DLSS 3 (в качестве примера посмотрите на маркер цели 150M), но в целом это удивительно точное изображение.

Также стоит отметить, что нам приходится просматривать отдельные кадры только для того, чтобы найти артефакты. Вы можете обнаружить странную отсутствующую ветку или размытый знак, но вставленные кадры проходят так быстро, что ошибки практически незаметны во время реального игрового процесса. Наоборот, вы заметите, насколько более плавным становится использование DLSS 3.

Конечно, для геймеров с панелями с высокой частотой обновления технология имеет смысл, но убедить киберспортивную аудиторию будет легче сказать, чем сделать. Это та область, где точные кадры имеют наибольшее значение.

Также следует учитывать задержку. В приведенных выше тестах средняя задержка составила 85 мс при полностью отключенном DLSS. Задержка снижается до 31 мс при включенном суперразрешении в режиме качества, но затем увеличивается до 45 мс, когда суперразрешение и генерация кадров работают в тандеме.

Много пищи для размышлений. Проверка DLSS 3 будет серьезно продолжена с выпуском совместимых розничных игр. А пока считайте нас заинтригованными и немного оптимистичными.

 

Вывод

Ада Лавлейс представляет собой нечто большее, чем просто новую архитектуру графического процессора, и представляет собой признание того, что мир графики должен развиваться, чтобы реализовать значительные достижения в области 3D-визуализации.

Одной только растеризации недостаточно, и, как и в случае с большинством основных современных процессорных технологий, специализированные ядра станут предпочтительным оружием, которое поможет разработчикам достичь настоящего прогресса следующего поколения. Nvidia сделала большую ставку на RT и тензорные ядра, и хотя только время покажет, является ли DLSS серебряной пулей, на которую она рассчитана, RTX, по крайней мере, открывает важный разговор.

Наиболее полное воплощение этого нового мировоззрения представлено в GeForce RTX 4090, мощном графическом процессоре, превосходящем практически все показатели производительности. Существенный рост растеризации наряду с ускоренными ядрами RT обеспечивает превосходные результаты, а когда вы добавляете потенциал DLSS 3, частота кадров с трассировкой лучей действительно начинает расти. Мы должны ожидать не меньшего, когда работают 76 миллиардов транзисторов, но приятно видеть, что все объединяется в процессе TSMC 4N.

Мы часто наблюдаем, как продукты Halo приносят убывающую отдачу по непомерно высокой цене, но впервые за долгое время это не относится к топовой RTX 4090. Хотя, несомненно, она стоит более 1600 фунтов стерлингов, она предвещает уровень производительности, который все еще удается. чтобы чувствовать себя хорошо для тех, кто играет на этом крайнем конце рынка.

Мы считаем, что более насущной проблемой является то, как разработчики используют новую технологию. Есть возможность раздвинуть границы графики для ПК, но наше время с предварительными играми DLSS 3 предполагает, что есть какой-то путь с точки зрения оптимизации и стабильности. Также стоит отметить повышенные системные требования. RTX 4090 настолько быстр, что требует достаточно дорогого сопутствующего оборудования; включите в свои планы экран с высоким разрешением и современный процессор.

Энтузиастам ПК, стремящимся к следующему значительному увеличению производительности в играх, не нужно искать дальше. GeForce RTX 4090 — потрясающее обновление для всех, кто готов платить по счетам.

Обзор Palit GeForce RTX 4090 GameRock OC: привет, мой маленький друг!

 

Palit GeForce RTX 4090 GameRock OC

Вердикт: невероятно быстрая GeForce RTX 4090 — единственный выбор для ультрасовременных игровых систем.

 

 

ПлюсыМинусы
  • Невероятная производительность
  • DLSS 3.0 меняет правила игры
  • Работает тихо и прохладно
  • Один разъем питания
  • Память 24 ГБ
  • 450 Вт теперь норма
  • Большая занимаемая площадь

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (1 оценок, среднее: 5,00 из 5)
Загрузка...
Поделиться в соц. сетях:


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

**ссылки nofollow

Это может быть вам интересно


Рекомендуемое
Графические процессоры Nvidia GeForce RTX 40 Series прожили волшебную жизнь. RTX…

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: