💬 Технология искусственного клонирования голоса Microsoft настолько хороша, что вы не сможете ее использовать

Опубликовано: 2024-07-06

Время чтения:

Технология искусственного клонирования голоса Microsoft настолько хороша, что вы не сможете ее использовать

👑 Premium-робот: получай более 20-ти торговых идей в день!

Размер текста

Технология искусственного клонирования голоса Microsoft настолько хороша, что вы не сможете ее использовать

Исследовательская группа Microsoft представила VALL-E 2, новую систему искусственного интеллекта для синтеза речи, способную генерировать голоса «на человеческом уровне» всего за несколько секунд звука, неотличимые от источника.

«(VALL-E 2 — это) новейшее достижение в области языковых моделей нейронных кодеков, которое знаменует собой веху в нулевом синтезе текста в речь (TTS), впервые достигая человеческого равенства», — говорится в исследовательской статье. Система основан на своем предшественнике VALL-E, представленном в начале 2023 года. Модели языка нейронных кодеков представляют речь как последовательности кода.

По словам команды, что отличает VALL-E 2 от других методов клонирования голоса, так это метод «повторной выборки» и адаптивное переключение между методами выборки. Стратегии повышают последовательность и решают наиболее распространенные проблемы традиционного генеративного голоса.

«VALL-E 2 последовательно синтезирует высококачественную речь, даже для предложений, которые традиционно сложны из-за их сложности или повторяющихся фраз», — пишут исследователи, отмечая, что технология может помочь генерировать речь для людей, которые теряют способность говорить.

Однако каким бы впечатляющим этот инструмент ни был, он не будет доступен широкой публике.

«В настоящее время у нас нет планов включать VALL-E 2 в продукт или расширять доступ к нему для общественности», — заявила Microsoft в своем этическом заявлении, отметив, что такие инструменты несут риски, такие как имитация голоса без согласия и использование убедительных голосов ИИ в мошенничество и другая преступная деятельность.

Исследовательская группа подчеркнула, что существует необходимость в стандартном методе цифровой маркировки поколений ИИ, признавая, что обнаружение контента, созданного ИИ, с высокой точностью по-прежнему остается проблемой.

«Если модель обобщается на невидимых говорящих в реальном мире, она должна включать протокол, гарантирующий, что говорящий одобряет использование своего голоса, и модель обнаружения синтезированной речи», — написали они.

Тем не менее, результаты VALL-E 2 очень точны по сравнению с другими инструментами. В серии тестов, проведенных исследовательской группой, VALL-E 2 превзошел человеческие тесты по надежности, естественности и сходству генерируемой речи.

VALL-E-2 смог достичь этих результатов всего с 3 секундами аудио. Однако исследовательская группа отметила, что «использование 10-секундных речевых образцов привело к еще лучшему качеству».

Microsoft — не единственная компания, занимающаяся искусственным интеллектом, которая продемонстрировала передовые модели искусственного интеллекта, не выпустив их. Voicebox от Meta и Voice Engine от OpenAI — два впечатляющих голосовых клонера, которые также сталкиваются с аналогичными ограничениями.

«Существует множество интересных вариантов использования генеративных речевых моделей, но из-за потенциальных рисков ненадлежащего использования мы на данный момент не делаем модель или код Voicebox общедоступными», — сообщил представитель Meta AI изданию Decrypt в прошлом году.

Кроме того, OpenAI объяснила, что пытается сначала решить проблему безопасности, прежде чем запускать свою модель синтетических голосов.

«В соответствии с нашим подходом к безопасности ИИ и нашими добровольными обязательствами, мы предпочитаем в настоящее время предварительно просмотреть эту технологию, но не выпускать ее широко», — пояснил OpenAI в официальном сообщении в блоге.

Этот призыв к этическим принципам распространяется по всему сообществу ИИ, особенно когда регулирующие органы начинают выражать обеспокоенность по поводу влияния генеративного ИИ на нашу повседневную жизнь.

Под редакцией Райана Одзавы.

Ограничение / снятие ответственности (дисклеймер): Вся информация на этом сайте предоставляется исключительно в информационных целях и не является предложением или рекомендацией к покупке, продаже или удержанию каких-либо ценных бумаг, акций или других финансовых инструментов. Авторы контента не несут ответственности за действия пользователей, основанные на предоставленной информации. Пользователи обязаны самостоятельно оценивать риски и проконсультироваться со специалистами перед принятием каких-либо инвестиционных решений. Вся информация на сайте может быть изменена без предварительного уведомления.

💬 Технология искусственного клонирования голоса Microsoft настолько хороша, что вы не сможете ее использовать

Технология искусственного клонирования голоса Microsoft настолько хороша, что вы не сможете ее использовать

Свежие новости по теме: Криптовалюта, NFT и криптобиржи

XRP может готовиться к серьезным ралли, несмотря на слабую реакцию ETF

Ripple Dipo слухи о том, чтобы нагреваться - вырос ли xrp за 3 доллара?

Ozean расширяет возможности финансирования МСП через Defa Partnership

SEC Review начинается на Canary HBAR ETF, поддерживаемое Hedera Network Token

XRP вытирает более 10 миллиардов долларов в неделю

Соответствие как катализатора: ключ к массовому принятию и будущему крипто | Мнение

Интеграция интеллекта уля

Иран - Напряжение в Израиле продолжается, Иран теперь шокирован Hack News! 82 миллиона долларов Альткойн украден! Заявление об обмене!

Биткойн повторяет 50-дневную среднюю поддержку; XRP рискует, как Dogecoin, похожий на медвежье, медвежье импульс