Логотип

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Shotcut 24.10, бесплатный кроссплатформенный видеоредактор, дебютирует с функцией преобразования речи в текст на основе ИИ с помощью Whisper от OpenAI, а также с расширенной функцией автоматической генерации субтитров для авторов.

Shotcut только что выпустил версию 24.10, в которой есть множество интересных обновлений, которые наверняка оценят создатели видео. В этом новом выпуске под названием «Whisper to a Scream» впервые реализована интеграция Shotcut с искусственным интеллектом, а также ряд улучшений для плавных переходов и заметных исправлений, которые делают редактирование более эффективным.

Возможно, самой ожидаемой особенностью Shotcut 24.10 является его интеграция с Whisper от OpenAI, представленная вам в рамках проекта whisper.cpp. Эту функцию преобразования речи в текст на основе искусственного интеллекта можно найти в меню “Субтитры” > “Преобразование речи в текст” или щелкнув значок.

Сборки поставляются с базовой моделью, которая хорошо сочетает в себе скорость и точность, не занимая много места. Кроме того, можно скачать более крупную модель в формате ggml для тех, кому нужна ещё большая точность.

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Видеоредактор Shotcut 24.10

 

Однако важно отметить, что эта улучшенная модель будет работать медленнее. При использовании функции «Речь в текст» процесс включает в себя два задания, которые вы увидите на панели «Задания»: одно для экспорта аудио, а другое для преобразования его в текст. Результат добавляется на панель «Субтитры» в качестве новой дорожки.

Читать  TensorFlow - Математические основы

Следует помнить, что в настоящее время для ускорения работы поддерживаются только графические процессоры Apple Silicon, в то время как другие системы зависят от многопоточной обработки данных процессором.

Есть ещё одна известная особенность: иногда субтитры начинают воспроизводиться раньше, чем ожидалось. Разработчики Shotcut отметили, что это время напрямую зависит от модели Whisper, и иногда могут возникать ошибки, как и в случае с человеческими ошибками в неидеальных условиях.

Компания OpenAI также предупредила об этических проблемах, связанных с Whisper, в частности, о том, что не следует использовать его для расшифровки записей, сделанных без согласия, или в ситуациях, когда от решения зависит многое.

Помимо функции преобразования речи в текст и улучшенных переходов, стоит отметить ещё несколько изменений. Среди улучшений качества жизни:

  • Кнопка “Экспорт” > “Видео” > “Повторная выборка” была удалена и заменена встроенными предупреждениями, которые легко игнорировать при определенных изменениях.
  • В меню «Файл» добавлена новая опция «Показать проект в папке» для удобства доступа.
  • В видеофильтре GPS Text теперь есть новая опция с числовыми ключевыми словами, которая поддерживает десятичные дроби.
  • Список «Недавние проекты» теперь называется просто «Проекты», что позволяет сохранять старые элементы, даже если количество последних проектов достигло предела.
Читать  Grok 2.5 не является открытым исходным кодом, несмотря на то, что Маск говорит, что да

 

Кроме того, обновление включает в себя множество исправлений, которые делают Shotcut более надёжным. Среди устранённых проблем — сбои при добавлении элементов в слайд-шоу, ошибки с дорожками субтитров, проблемы с частотой кадров AVCHD и сбои в визуальном управлении Reframe, которые приводили к сбоям при экспорте.

Кроме того, Shotcut обновил версию FFmpeg до 7.1, обеспечив совместимость и улучшив производительность.

Подробную информацию об изменениях в видеоредакторе Shotcut 24.10 см. в объявлении о выпуске.

Вы можете скачать приложение в универсальном формате AppImage, готовом к использованию в любом дистрибутиве Linux. Кроме того, доступны установочные файлы для Windows и macOS.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Редактор: AndreyEx

Рейтинг: 0 (0 голосов)

Важно: Данная статья носит информационный характер. Автор не несёт ответственности за возможные сбои или ошибки, возникшие при использовании описанного программного обеспечения.

Если статья понравилась, то поделитесь ей в социальных сетях:
5 1 голос
Рейтинг статьи
Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Это может быть вам интересно


Загрузка...

Спасибо!

Теперь редакторы в курсе.

Прокрутить страницу до начала