ИТ Блог. Администрирование серверов на основе Linux (Ubuntu, Debian, CentOS, openSUSE)
Понедельник, 31 марта, 2025
Сегодня у нас 1 праздник:
Международный День Резервного Копирования (World Backup Day). Пользователи сайта социальных новостей reddit предложили сделать дату 31.03 Международным днём резервного копирования, аргументируя это тем, что никогда заранее нельзя узнать, какие сюрпризы преподнесёт 1.04

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Shotcut 24.10, бесплатный кроссплатформенный видеоредактор, дебютирует с функцией преобразования речи в текст на основе ИИ с помощью Whisper от OpenAI, а также с расширенной функцией автоматической генерации субтитров для авторов.

Shotcut только что выпустил версию 24.10, в которой есть множество интересных обновлений, которые наверняка оценят создатели видео. В этом новом выпуске под названием «Whisper to a Scream» впервые реализована интеграция Shotcut с искусственным интеллектом, а также ряд улучшений для плавных переходов и заметных исправлений, которые делают редактирование более эффективным.

Возможно, самой ожидаемой особенностью Shotcut 24.10 является его интеграция с Whisper от OpenAI, представленная вам в рамках проекта whisper.cpp. Эту функцию преобразования речи в текст на основе искусственного интеллекта можно найти в меню “Субтитры” > “Преобразование речи в текст” или щелкнув значок.

Сборки поставляются с базовой моделью, которая хорошо сочетает в себе скорость и точность, не занимая много места. Кроме того, можно скачать более крупную модель в формате ggml для тех, кому нужна ещё большая точность.

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Видеоредактор Shotcut 24.10

 

Однако важно отметить, что эта улучшенная модель будет работать медленнее. При использовании функции «Речь в текст» процесс включает в себя два задания, которые вы увидите на панели «Задания»: одно для экспорта аудио, а другое для преобразования его в текст. Результат добавляется на панель «Субтитры» в качестве новой дорожки.

Следует помнить, что в настоящее время для ускорения работы поддерживаются только графические процессоры Apple Silicon, в то время как другие системы зависят от многопоточной обработки данных процессором.

Есть ещё одна известная особенность: иногда субтитры начинают воспроизводиться раньше, чем ожидалось. Разработчики Shotcut отметили, что это время напрямую зависит от модели Whisper, и иногда могут возникать ошибки, как и в случае с человеческими ошибками в неидеальных условиях.

Компания OpenAI также предупредила об этических проблемах, связанных с Whisper, в частности, о том, что не следует использовать его для расшифровки записей, сделанных без согласия, или в ситуациях, когда от решения зависит многое.

Помимо функции преобразования речи в текст и улучшенных переходов, стоит отметить ещё несколько изменений. Среди улучшений качества жизни:

 

Кроме того, обновление включает в себя множество исправлений, которые делают Shotcut более надёжным. Среди устранённых проблем — сбои при добавлении элементов в слайд-шоу, ошибки с дорожками субтитров, проблемы с частотой кадров AVCHD и сбои в визуальном управлении Reframe, которые приводили к сбоям при экспорте.

Кроме того, Shotcut обновил версию FFmpeg до 7.1, обеспечив совместимость и улучшив производительность.

Подробную информацию об изменениях в видеоредакторе Shotcut 24.10 см. в объявлении о выпуске.

Вы можете скачать приложение в универсальном формате AppImage, готовом к использованию в любом дистрибутиве Linux. Кроме того, доступны установочные файлы для Windows и macOS.

Exit mobile version