Этот инструмент AI в реальном времени может создать «фотореалистичный шедевр» из простой описательной фразы, а затем настроить результат с помощью мазков кисти.
Nvidia продемонстрировала последнюю версию своего художественного приложения GauGAN AI. GauGAN2 принимает несколько слов или фразу в качестве входных данных и может из этого крошечного семени создать «фотореалистичный шедевр». Тем не менее, он позволяет проявить больше чутья и творчества, позволяя пользователям затем настраивать изображение с помощью «умной кисти» с такими дескрипторами, как небо, дерево, камень или река.
Все мы знакомы с фразой, в которой изображение произносит тысячу слов, но благодаря современному ИИ мы можем почти перевернуть эту фразу с ног на голову. Используя GauGAN2, простая фраза, такая как «закат на пляже», создает привлекательную сцену в реальном времени. Более того, его можно настроить дополнительно, используя дополнительное прилагательное, например, «закат на каменистом пляже», и вы увидите изменение в режиме реального времени.
GauGAN2 не ограничивает ваше творчество шаблонной фразой. После того, как вы настроили базовую сцену, достаточно щелкнуть мышью, чтобы сгенерировать карту сегментации, чтобы обеспечить высокоуровневую схему составляющих сцены. С этого момента пользователи могут переключаться на рисование и настройку грубых, но реалистичных эскизов, используя такие ярлыки, как небо, облака, горы, холмы, туман, вода, море, снег, дорога, мост, стена и многие другие.
Как это все работает? «GAN» в GauGAN2 является сокращением от Generative Adversarial Network — сети, которая может создавать новое из старого — а «старый» источник — это 10 миллионов высококачественных изображений ландшафта, которые были описаны и обработаны суперкомпьютером Nvidia Selene, Nvidia Система на базе DGX SuperPOD.
Когда компьютер научится описывать изображения, процесс можно перевернуть, и текстовые строки будут генерировать изображения. Nvidia добавляет дополнительные улучшения в GauGAN2 в виде сегментации и модификаций с помощью мазков кисти или стилей.
Любой, у кого есть графический процессор Nvidia RTX, может загрузить и протестировать технологию GauGAN с помощью приложения Nvidia Canvas. GauGAN2 выглядит как еще один отличный инструмент для Nvidia и ее пользователей, с помощью которого можно быстро создавать и заполнять творения Omniverse/metaverse.