Поиск по сайту:
Не создатели, а пользователи должны параметризовать процедуры. (Алан.Дж.Перлис)

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

30.10.2024
Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Shotcut 24.10, бесплатный кроссплатформенный видеоредактор, дебютирует с функцией преобразования речи в текст на основе ИИ с помощью Whisper от OpenAI, а также с расширенной функцией автоматической генерации субтитров для авторов.

Shotcut только что выпустил версию 24.10, в которой есть множество интересных обновлений, которые наверняка оценят создатели видео. В этом новом выпуске под названием «Whisper to a Scream» впервые реализована интеграция Shotcut с искусственным интеллектом, а также ряд улучшений для плавных переходов и заметных исправлений, которые делают редактирование более эффективным.

Возможно, самой ожидаемой особенностью Shotcut 24.10 является его интеграция с Whisper от OpenAI, представленная вам в рамках проекта whisper.cpp. Эту функцию преобразования речи в текст на основе искусственного интеллекта можно найти в меню “Субтитры” > “Преобразование речи в текст” или щелкнув значок.

Сборки поставляются с базовой моделью, которая хорошо сочетает в себе скорость и точность, не занимая много места. Кроме того, можно скачать более крупную модель в формате ggml для тех, кому нужна ещё большая точность.

Выпущен видеоредактор Shotcut 24.10 с открытым исходным кодом и функцией преобразования речи в текст на основе ИИ

Видеоредактор Shotcut 24.10

 

Однако важно отметить, что эта улучшенная модель будет работать медленнее. При использовании функции «Речь в текст» процесс включает в себя два задания, которые вы увидите на панели «Задания»: одно для экспорта аудио, а другое для преобразования его в текст. Результат добавляется на панель «Субтитры» в качестве новой дорожки.

Читать  TensorFlow - Оптимизация градиентного спуска

Следует помнить, что в настоящее время для ускорения работы поддерживаются только графические процессоры Apple Silicon, в то время как другие системы зависят от многопоточной обработки данных процессором.

Есть ещё одна известная особенность: иногда субтитры начинают воспроизводиться раньше, чем ожидалось. Разработчики Shotcut отметили, что это время напрямую зависит от модели Whisper, и иногда могут возникать ошибки, как и в случае с человеческими ошибками в неидеальных условиях.

Компания OpenAI также предупредила об этических проблемах, связанных с Whisper, в частности, о том, что не следует использовать его для расшифровки записей, сделанных без согласия, или в ситуациях, когда от решения зависит многое.

Помимо функции преобразования речи в текст и улучшенных переходов, стоит отметить ещё несколько изменений. Среди улучшений качества жизни:

  • Кнопка “Экспорт” > “Видео” > “Повторная выборка” была удалена и заменена встроенными предупреждениями, которые легко игнорировать при определенных изменениях.
  • В меню «Файл» добавлена новая опция «Показать проект в папке» для удобства доступа.
  • В видеофильтре GPS Text теперь есть новая опция с числовыми ключевыми словами, которая поддерживает десятичные дроби.
  • Список «Недавние проекты» теперь называется просто «Проекты», что позволяет сохранять старые элементы, даже если количество последних проектов достигло предела.

 

Кроме того, обновление включает в себя множество исправлений, которые делают Shotcut более надёжным. Среди устранённых проблем — сбои при добавлении элементов в слайд-шоу, ошибки с дорожками субтитров, проблемы с частотой кадров AVCHD и сбои в визуальном управлении Reframe, которые приводили к сбоям при экспорте.

Читать  Прототип нового опытного помощника Google по ИИ хочет вести видеочат с помощью вашего телефона - и ваших очков

Кроме того, Shotcut обновил версию FFmpeg до 7.1, обеспечив совместимость и улучшив производительность.

Подробную информацию об изменениях в видеоредакторе Shotcut 24.10 см. в объявлении о выпуске.

Вы можете скачать приложение в универсальном формате AppImage, готовом к использованию в любом дистрибутиве Linux. Кроме того, доступны установочные файлы для Windows и macOS.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (1 оценок, среднее: 5,00 из 5)
Загрузка...
Поделиться в соц. сетях:


5 1 голос
Рейтинг статьи
Подписаться
Уведомить о
guest

**ссылки nofollow

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Это может быть вам интересно


Рекомендуемое
Промышленные осушители воздуха работают в несколько раз мощнее, чем бытовые.…

Спасибо!

Теперь редакторы в курсе.