11 s ·Translate

Технологический стартап ElevenLabs запустил программу на основе искусственного интеллекта (ИИ) для автоматического создания звуков окружения на основе текстовых подсказок.
Об этом сообщается на официальной странице компании в социальной сети X (ранее — Twitter). Авторы новой нейросети продемонстрировали ее возможности на примере беззвучных видеороликов, сгенерированных с помощью генеративной модели Sora фирмы OpenAI, передает gazeta.ru
«Мы использовали текстовые подсказки, такие как «грохот волн», «звон металла», «чириканье птиц» и «двигатель гоночного автомобиля», для создания звука, который мы наложили на некоторые из наших любимых клипов из анонса OpenAI Sora», — отметили в ElevenLabs.
В демонстрационном видео показаны и другие примеры работы алгоритма, включая шум улицы мегаполиса, механический гул робота и лай щенков.
ElevenLabs известна как разработчик ИИ-системы по преобразованию текста в синтезированную речь и автоматического дубляжа видео с поддержкой более чем 20 языков.

image