Логотип

Sora 2 улучшает создание видео с помощью искусственного интеллекта и добавляет управление повествованием, аудио и социальными приложениями

Sora 2 улучшает создание видео с помощью искусственного интеллекта и добавляет управление повествованием, аудио и социальными приложениями

Создание видео с помощью искусственного интеллекта перестало быть простым технологическим курьезом и превратилось в область активного развития, где модели стремятся не только к более высокому визуальному качеству, но и к более последовательному представлению мира. В этом контексте Sora 2 представляет собой шаг вперед по сравнению со своей предыдущей версией, внося существенные улучшения в физику, звук, управление повествованием и возможности настройки.

OpenAI определяет эту новую модель как эквивалент того, что предполагала GPT-3.5 в области языка. В то время как первая версия Sora служила доказательством концепции — способной создавать короткие клипы с реалистичным внешним видом, — Sora 2 более близка к физически последовательному изображению сцен, включая даже преднамеренные ошибки, которые повышают достоверность сгенерированного материала. Моделирование теперь лучше реагирует на основные физические законы, такие как движение жидкостей, динамические тени или окклюзия между объектами.

Одним из наиболее заметных достижений является возможность создавать более длинные последовательности с последовательными переходами и более управляемым повествованием. Модель позволяет изменять плоскость, изменять глубину резкости и модулировать фокусировку сцен. К этому добавляется большая стилистическая универсальность: Sora 2 может создавать видео в самых разных стилях, от традиционного кинематографа до аниме, с заметно большей степенью визуальной согласованности, чем у его предшественника.

В области звука Sora 2 впервые включает автоматическую генерацию голоса, эффектов и эмбиентной музыки. Это позволяет создавать не только визуально достоверные, но и полные на слух видеоролики без необходимости последующего редактирования. Кроме того, модель поддерживает вставку реальных людей из фотографий и клипов, сохраняя их визуальную и вокальную идентичность с точностью, которая, хотя и не идеальна, близка к функциональной для многократного использования.

Читать  TensorFlow - разница между CNN и RNN

 

Социальное измерение появилось с запуском App Sora, приложения для iOS, которое позволяет пользователям создавать видео и делиться ими, а также участвовать в “эпизодических ролях” в клипах других пользователей. Идея состоит в том, чтобы упростить новую форму визуального общения, при которой люди могут творчески интегрироваться в созданные сцены, обмениваясь не только сообщениями, но и появлениями в персонализированном контенте.

OpenAI сопровождает объявление рядом мер по снижению рисков, связанных с этим типом технологий. Видео, созданные пользователями-подростками, будут иметь определенные ограничения, и будут введены механизмы модерирования контента с помощью описаний на естественном языке. Также ограничено использование инструмента для создания реалистичных видеороликов с участием общественных деятелей, и его использование в качестве творческого инструмента имеет приоритет перед пассивным потреблением контента.

С помощью Sora 2 OpenAI стремится открыть новые технические возможности при более строгой структуре управления. Эволюция модели поднимает актуальные вопросы о законном использовании, возможных злоупотреблениях и ограничениях, которые должны регулировать системы такого типа. Мы не сталкиваемся с немедленной революцией, но мы сталкиваемся с четкой консолидацией курса, по которому пойдет визуальный искусственный интеллект в ближайшие годы.

Редактор: AndreyEx

Рейтинг: 5 (1 голос)
Важно: Данная статья носит информационный характер. Автор не несёт ответственности за возможные сбои или ошибки, возникшие при использовании описанного программного обеспечения.
Если статья понравилась, то поделитесь ей в социальных сетях:
0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Это может быть вам интересно


Загрузка...

Спасибо!

Теперь редакторы в курсе.

Прокрутить страницу до начала