💬 Технология искусственного клонирования голоса Microsoft настолько хороша, что вы не сможете ее использовать

Технология искусственного клонирования голоса Microsoft настолько хороша, что вы не сможете ее использовать
Исследовательская группа Microsoft представила VALL-E 2, новую систему искусственного интеллекта для синтеза речи, способную генерировать голоса «на человеческом уровне» всего за несколько секунд звука, неотличимые от источника.
«(VALL-E 2 — это) новейшее достижение в области языковых моделей нейронных кодеков, которое знаменует собой веху в нулевом синтезе текста в речь (TTS), впервые достигая человеческого равенства», — говорится в исследовательской статье. Система основан на своем предшественнике VALL-E, представленном в начале 2023 года. Модели языка нейронных кодеков представляют речь как последовательности кода.
По словам команды, что отличает VALL-E 2 от других методов клонирования голоса, так это метод «повторной выборки» и адаптивное переключение между методами выборки. Стратегии повышают последовательность и решают наиболее распространенные проблемы традиционного генеративного голоса.
«VALL-E 2 последовательно синтезирует высококачественную речь, даже для предложений, которые традиционно сложны из-за их сложности или повторяющихся фраз», — пишут исследователи, отмечая, что технология может помочь генерировать речь для людей, которые теряют способность говорить.
Однако каким бы впечатляющим этот инструмент ни был, он не будет доступен широкой публике.
«В настоящее время у нас нет планов включать VALL-E 2 в продукт или расширять доступ к нему для общественности», — заявила Microsoft в своем этическом заявлении, отметив, что такие инструменты несут риски, такие как имитация голоса без согласия и использование убедительных голосов ИИ в мошенничество и другая преступная деятельность.
Исследовательская группа подчеркнула, что существует необходимость в стандартном методе цифровой маркировки поколений ИИ, признавая, что обнаружение контента, созданного ИИ, с высокой точностью по-прежнему остается проблемой.
«Если модель обобщается на невидимых говорящих в реальном мире, она должна включать протокол, гарантирующий, что говорящий одобряет использование своего голоса, и модель обнаружения синтезированной речи», — написали они.
Тем не менее, результаты VALL-E 2 очень точны по сравнению с другими инструментами. В серии тестов, проведенных исследовательской группой, VALL-E 2 превзошел человеческие тесты по надежности, естественности и сходству генерируемой речи.

VALL-E-2 смог достичь этих результатов всего с 3 секундами аудио. Однако исследовательская группа отметила, что «использование 10-секундных речевых образцов привело к еще лучшему качеству».
Microsoft — не единственная компания, занимающаяся искусственным интеллектом, которая продемонстрировала передовые модели искусственного интеллекта, не выпустив их. Voicebox от Meta и Voice Engine от OpenAI — два впечатляющих голосовых клонера, которые также сталкиваются с аналогичными ограничениями.
«Существует множество интересных вариантов использования генеративных речевых моделей, но из-за потенциальных рисков ненадлежащего использования мы на данный момент не делаем модель или код Voicebox общедоступными», — сообщил представитель Meta AI изданию Decrypt в прошлом году.
Кроме того, OpenAI объяснила, что пытается сначала решить проблему безопасности, прежде чем запускать свою модель синтетических голосов.
«В соответствии с нашим подходом к безопасности ИИ и нашими добровольными обязательствами, мы предпочитаем в настоящее время предварительно просмотреть эту технологию, но не выпускать ее широко», — пояснил OpenAI в официальном сообщении в блоге.
Этот призыв к этическим принципам распространяется по всему сообществу ИИ, особенно когда регулирующие органы начинают выражать обеспокоенность по поводу влияния генеративного ИИ на нашу повседневную жизнь.
Под редакцией Райана Одзавы.
Ограничение / снятие ответственности (дисклеймер): Вся информация на этом сайте предоставляется исключительно в информационных целях и не является предложением или рекомендацией к покупке, продаже или удержанию каких-либо ценных бумаг, акций или других финансовых инструментов. Авторы контента не несут ответственности за действия пользователей, основанные на предоставленной информации. Пользователи обязаны самостоятельно оценивать риски и проконсультироваться со специалистами перед принятием каких-либо инвестиционных решений. Вся информация на сайте может быть изменена без предварительного уведомления.
Свежие новости по теме: Криптовалюта, NFT и криптобиржи
-
Криптовалюта и NFT
SEC - это «прокладываю путь к росту» в крипто
2025-04-01 просмотры: 243 -
Криптовалюта и NFT
Эксперт говорит, что в 2025 году xrp не увидит более высоких цен в 2025 году
2025-04-01 просмотры: 178 -
Криптовалюта и NFT
Медвежий догкоин
2025-04-01 просмотры: 326 -
Криптовалюта и NFT
SEC официально признает предложение 21Shares о пятничном ETF Полкадот
2025-04-01 просмотры: 164 -
Криптовалюта и NFT
551 000 000 000 000 000 Shiba Inu (Shib) Уровень: чего ожидать?
2025-04-01 просмотры: 395 -
Криптовалюта и NFT
Кава (Кава) бросает вызов рынке, сказывается на 30-дневном максимуме
2025-04-01 просмотры: 313 -
Криптовалюта и NFT
1 крипто -монета для покупки, 1 альткойн для продажи в 2025 году: Полкадо, Полигон
2025-04-01 просмотры: 350 -
Криптовалюта и NFT
Система Toshiba, работающая на мощности, поддерживает сотрудничество роботов с безопасной, децентрализованной технологией
2025-04-01 просмотры: 179 -
Криптовалюта и NFT
Крипто -услуги поставщики глазных индийских рынков, поскольку Индия сигнализирует о сдвиге в крипто -регулировании
2025-04-01 просмотры: 398