Strona główna » Ai e-book o sztucznej inteligencji » Suno AI – nowy model zamiany tekstu na muzykę

Suno AI – nowy model zamiany tekstu na muzykę

by kapdes
sunoai

Amerykański startup Suno specjalizuje się w generowaniu dźwięku AI z tekstu.

Jego najnowszy model audio generuje imponujące utwory. Na początku września Suno zaprezentowało swój najnowszy model zamiany tekstu na piosenkę, Chirp v1, który może generować muzykę, w tym wokale, w oparciu o styl i tekst. Największym ulepszeniem jest to, że v1 może konwertować gatunki takie jak rock, pop, K-pop i opisy takie jak melodyjny lub szybki na muzykę.

Teksty piosenek można teraz dzielić na części za pomocą poleceń takich jak [wers] i [refren], aby nadać generowanym utworom więcej struktury. Teksty mogą być wpisywane lub generowane bezpośrednio w interfejsie Chirp za pomocą ChatGPT.

Prompty z konkretnym odniesieniem do artysty nie są obsługiwane

Prawdopodobnie w celu uniknięcia dyskusji na temat praw autorskich. Tak było w przypadku, gdy wygenerowana przez sztuczną inteligencję piosenka z głosami Drake’a i The Weeknd stała się wirusowa. Utwór został następnie zablokowany przez Universal Music Group.

Generowanie piosenek AI na Discordzie

Generowanie Chirp jest w pełni zintegrowane z Discord, podobnie jak w Midjourney. Dla każdej zachęty Chirp model generuje dwie wariacje, zwykle o długości od 20 do 40 sekund. Jeśli spodoba ci się jakaś wariacja, możesz wygenerować więcej, klikając „Kontynuuj”, co może dodać do 30 sekund do generacji, kontynuując styl poprzedniej generacji.

Jeśli chcesz się zainspirować lub poznać potencjał Chirp, po prostu przejrzyj serwery Discord – ponad 40 000 użytkowników zapewnia stały dopływ utworów. Z pewnością znajdziesz perełkę lub dwie, takie jak ta politycznie umotywowana piosenka miłosna. Czy wkrótce usłyszymy jej więcej?

Możesz też wziąć istniejące teksty znanych piosenek i pozwolić sztucznej inteligencji wygenerować je w nowym stylu muzycznym.
Złożoność piosenek w połączeniu z jakością generowanych głosów jest czasami imponująca. Nie ma jeszcze hitów list przebojów, ale przy obecnym tempie rozwoju generatywnej sztucznej inteligencji może się to szybko zmienić. Suno opublikowało na swojej stronie internetowej kilka szczególnie dobrze brzmiących wersji demonstracyjnych nowego modelu.
Suno obsługuje ponad 50 języków, przy czym w moich testach najlepiej wypadł angielski i muzyka rockowa. Styl wydaje się również zależeć od treści lub struktury tekstu. Na podstawie tekstu generowany jest pasujący obraz tła dla każdego klipu audio.

Suno oferuje 250 darmowych kredytów miesięcznie na Discordzie. Mogą być generowane na serwerze publicznym lub w Discord DMs. Plan Pro oferuje 1000 kredytów / do 100 chirpsów miesięcznie i kosztuje 10 USD miesięcznie. Można zakupić dodatkowe generacje. 
Wiosną ubiegłego roku Suno wprowadziło Bark, model zamiany tekstu na mowę i dźwięk, który jest swobodnie dostępny na Githubie na licencji MIT do użytku komercyjnego. Bark jest również dostępny za pośrednictwem Discord.

Pozostałe artykuły