Vall-E – Microsoft jaunais mākslīgā intelekta modelis, kas atdarina jebkuru cilvēka balsi, pamatojoties tikai uz 3 sekunžu oriģinālu

133017c9ec1c770b13d69178385be375

Microsoft ir prezentējis jaunu mākslīgā intelekta modeli Vall-E. Tā pamatā ir tehnoloģija EnCodec, par kuru Meta paziņoja 2022. gada oktobrī.

Kas tas ir
Microsoft sauc VALL-E par “neironu kodeku valodas modeli”. Šis mākslīgais intelekts spēj atdarināt jebkuru cilvēka balsi, un tam pietiek noklausīties tikai 3 sekundes no oriģinālās balss. Mākslīgais intelekts sadala informāciju sastāvdaļās un sintezē skaņas variācijas dažādās frāzēs, kā rezultātā tas spēj precīzi atveidot runātāja tembru un emocionālo toni.

Lai apmācītu Vall-E, Microsoft izmantoja 60 000 stundu ilgu sarunu ierakstus, ko ierakstījuši vairāk nekā 7000 reālu cilvēku. Lielākā daļa no tām bija audiogrāmatas no LibriVox bibliotēkas.

Vall-E simulēto balsu piemērus var noklausīties GitHub vietnē.

Microsoft apgalvo, ka Vall-E var izmantot kā teksta pārvēršanas balsī rīku, runas rediģēšanas veidu un audio radīšanas sistēmu, apvienojot to ar citiem ģeneratīviem mākslīgajiem intelektiem.

Avots: Vall-E

Ja esat atklājis pareizrakstības kļūdu, lūdzu, paziņojiet mums, izvēloties šo tekstu un nospiežot Ctrl+Enter.

Related posts

Noticis masīvs krāpnieku uzbrukums vietnē “WhatsApp”

Google un Singapūras Universitāte ir radījušas rīku, lai ar mākslīgā intelekta palīdzību video pievienotu kameras kustību

Daži YouTube Premium abonenti sūdzas par reklāmām

Šī vietne izmanto sīkfailus, lai uzlabotu jūsu pieredzi. Mēs pieņemam, ka jūs ar to piekrītat, bet jūs varat atteikties, ja vēlaties. Lasīt vairāk