Shotcut 24.10, бесплатный кроссплатформенный видеоредактор, дебютирует с функцией преобразования речи в текст на основе ИИ с помощью Whisper от OpenAI, а также с расширенной функцией автоматической генерации субтитров для авторов.
Shotcut только что выпустил версию 24.10, в которой есть множество интересных обновлений, которые наверняка оценят создатели видео. В этом новом выпуске под названием «Whisper to a Scream» впервые реализована интеграция Shotcut с искусственным интеллектом, а также ряд улучшений для плавных переходов и заметных исправлений, которые делают редактирование более эффективным.
Возможно, самой ожидаемой особенностью Shotcut 24.10 является его интеграция с Whisper от OpenAI, представленная вам в рамках проекта whisper.cpp. Эту функцию преобразования речи в текст на основе искусственного интеллекта можно найти в меню “Субтитры” > “Преобразование речи в текст” или щелкнув значок.
Сборки поставляются с базовой моделью, которая хорошо сочетает в себе скорость и точность, не занимая много места. Кроме того, можно скачать более крупную модель в формате ggml для тех, кому нужна ещё большая точность.
Однако важно отметить, что эта улучшенная модель будет работать медленнее. При использовании функции «Речь в текст» процесс включает в себя два задания, которые вы увидите на панели «Задания»: одно для экспорта аудио, а другое для преобразования его в текст. Результат добавляется на панель «Субтитры» в качестве новой дорожки.
Следует помнить, что в настоящее время для ускорения работы поддерживаются только графические процессоры Apple Silicon, в то время как другие системы зависят от многопоточной обработки данных процессором.
Есть ещё одна известная особенность: иногда субтитры начинают воспроизводиться раньше, чем ожидалось. Разработчики Shotcut отметили, что это время напрямую зависит от модели Whisper, и иногда могут возникать ошибки, как и в случае с человеческими ошибками в неидеальных условиях.
Компания OpenAI также предупредила об этических проблемах, связанных с Whisper, в частности, о том, что не следует использовать его для расшифровки записей, сделанных без согласия, или в ситуациях, когда от решения зависит многое.
Помимо функции преобразования речи в текст и улучшенных переходов, стоит отметить ещё несколько изменений. Среди улучшений качества жизни:
- Кнопка “Экспорт” > “Видео” > “Повторная выборка” была удалена и заменена встроенными предупреждениями, которые легко игнорировать при определенных изменениях.
- В меню «Файл» добавлена новая опция «Показать проект в папке» для удобства доступа.
- В видеофильтре GPS Text теперь есть новая опция с числовыми ключевыми словами, которая поддерживает десятичные дроби.
- Список «Недавние проекты» теперь называется просто «Проекты», что позволяет сохранять старые элементы, даже если количество последних проектов достигло предела.
Кроме того, обновление включает в себя множество исправлений, которые делают Shotcut более надёжным. Среди устранённых проблем — сбои при добавлении элементов в слайд-шоу, ошибки с дорожками субтитров, проблемы с частотой кадров AVCHD и сбои в визуальном управлении Reframe, которые приводили к сбоям при экспорте.
Кроме того, Shotcut обновил версию FFmpeg до 7.1, обеспечив совместимость и улучшив производительность.
Подробную информацию об изменениях в видеоредакторе Shotcut 24.10 см. в объявлении о выпуске.
Вы можете скачать приложение в универсальном формате AppImage, готовом к использованию в любом дистрибутиве Linux. Кроме того, доступны установочные файлы для Windows и macOS.