Strona główna » Ai e-book o sztucznej inteligencji » Meta Voicebox – nowy generator głosu

Meta Voicebox – nowy generator głosu

by kapdes
Meta-Voicebox

Meta wprowadza model sztucznej inteligencji o nazwie Voicebox, aby zrewolucjonizować produkcję głosu

Meta wprowadza model sztucznej inteligencji o nazwie Voicebox, aby zrewolucjonizować produkcję głosu

Meta, firma stojąca za Facebookiem, wprowadziła nowy model generatywnej sztucznej inteligencji o nazwie „Voicebox”, który może zrewolucjonizować produkcję głosu. Meta ujawniła w poście na blogu, że Voicebox jest pierwszym modelem zdolnym do generowania mowy z niezwykłą wydajnością, pomimo braku specjalnego szkolenia.

Zamiast typowych modeli tworzących grafikę lub tekst, Voicebox specjalizuje się w tworzeniu wysokiej jakości próbek audio. Może on tworzyć mowę na różne sposoby, zarówno od podstaw, jak i poprzez zmianę próbek. Synteza mowy obsługiwana jest w sześciu językach: Angielskim, francuskim, niemieckim, hiszpańskim, polskim i portugalskim. Voicebox obejmuje edycję treści, redukcję szumów, konwersję stylu i tworzenie różnych próbek.

Voicebox wyróżnia się przede wszystkim techniką uczenia się.

Voicebox uczy się bezpośrednio z surowych danych audio i powiązanych transkrypcji, a nie przy użyciu modeli autoregresyjnych. Pozwala to modelowi na zmianę dowolnego komponentu próbki, a nie tylko końca, zapewniając mu większą elastyczność i różnorodność.

Według Meta, Voicebox uczy się przewidywać segment mowy, biorąc pod uwagę otaczającą mowę i jej transkrypcję. Gdy model zrozumie, jak wypełniać mowę w zależności od kontekstu, można go zastosować do różnych zadań związanych z produkcją mowy, takich jak generowanie wybranych segmentów nagrania audio bez jego odtwarzania.

Voicebox wyróżnia się w różnych zastosowaniach ze względu na swoje możliwości adaptacyjne, w tym w kontekstowej syntezie mowy na tekst, międzyjęzykowym transferze stylu, odszumianiu i edycji głosu oraz zróżnicowanym próbkowaniu mowy – wszechstronność i wydajność modelu otwierają nowe możliwości kreatywnej produkcji dźwięku i zaawansowanej modyfikacji głosu.

voicebox_model

Voicebox firmy Meta to duży krok w tworzeniu mowy, prezentujący solidny model sztucznej inteligencji zdolny do tworzenia wysokiej jakości klipów audio i wykonywania różnych zadań związanych z mową z doskonałymi wynikami. Wraz z rozwojem technologii AI, Voicebox może utorować drogę do nowych zastosowań w technologiach wspomaganych głosem, rozrywce i innych dziedzinach.

Pozostałe artykuły