ИТ Блог. Администрирование серверов на основе Linux (Ubuntu, Debian, CentOS, openSUSE)

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Shotcut 24.10, бесплатный кроссплатформенный видеоредактор, дебютирует с функцией преобразования речи в текст на основе ИИ с помощью Whisper от OpenAI, а также с расширенной функцией автоматической генерации субтитров для авторов.

Shotcut только что выпустил версию 24.10, в которой есть множество интересных обновлений, которые наверняка оценят создатели видео. В этом новом выпуске под названием «Whisper to a Scream» впервые реализована интеграция Shotcut с искусственным интеллектом, а также ряд улучшений для плавных переходов и заметных исправлений, которые делают редактирование более эффективным.

Возможно, самой ожидаемой особенностью Shotcut 24.10 является его интеграция с Whisper от OpenAI, представленная вам в рамках проекта whisper.cpp. Эту функцию преобразования речи в текст на основе искусственного интеллекта можно найти в меню “Субтитры” > “Преобразование речи в текст” или щелкнув значок.

Сборки поставляются с базовой моделью, которая хорошо сочетает в себе скорость и точность, не занимая много места. Кроме того, можно скачать более крупную модель в формате ggml для тех, кому нужна ещё большая точность.

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Видеоредактор Shotcut 24.10

 

Однако важно отметить, что эта улучшенная модель будет работать медленнее. При использовании функции «Речь в текст» процесс включает в себя два задания, которые вы увидите на панели «Задания»: одно для экспорта аудио, а другое для преобразования его в текст. Результат добавляется на панель «Субтитры» в качестве новой дорожки.

Следует помнить, что в настоящее время для ускорения работы поддерживаются только графические процессоры Apple Silicon, в то время как другие системы зависят от многопоточной обработки данных процессором.

Есть ещё одна известная особенность: иногда субтитры начинают воспроизводиться раньше, чем ожидалось. Разработчики Shotcut отметили, что это время напрямую зависит от модели Whisper, и иногда могут возникать ошибки, как и в случае с человеческими ошибками в неидеальных условиях.

Компания OpenAI также предупредила об этических проблемах, связанных с Whisper, в частности, о том, что не следует использовать его для расшифровки записей, сделанных без согласия, или в ситуациях, когда от решения зависит многое.

Помимо функции преобразования речи в текст и улучшенных переходов, стоит отметить ещё несколько изменений. Среди улучшений качества жизни:

 

Кроме того, обновление включает в себя множество исправлений, которые делают Shotcut более надёжным. Среди устранённых проблем — сбои при добавлении элементов в слайд-шоу, ошибки с дорожками субтитров, проблемы с частотой кадров AVCHD и сбои в визуальном управлении Reframe, которые приводили к сбоям при экспорте.

Кроме того, Shotcut обновил версию FFmpeg до 7.1, обеспечив совместимость и улучшив производительность.

Подробную информацию об изменениях в видеоредакторе Shotcut 24.10 см. в объявлении о выпуске.

Вы можете скачать приложение в универсальном формате AppImage, готовом к использованию в любом дистрибутиве Linux. Кроме того, доступны установочные файлы для Windows и macOS.

Exit mobile version