Home » Vall-E – Microsoft jaunais mākslīgā intelekta modelis, kas atdarina jebkuru cilvēka balsi, pamatojoties tikai uz 3 sekunžu oriģinālu

Vall-E – Microsoft jaunais mākslīgā intelekta modelis, kas atdarina jebkuru cilvēka balsi, pamatojoties tikai uz 3 sekunžu oriģinālu

no ANDREJS BOJKO
0 Komentāri Ziedot
133017c9ec1c770b13d69178385be375

Microsoft ir prezentējis jaunu mākslīgā intelekta modeli Vall-E. Tā pamatā ir tehnoloģija EnCodec, par kuru Meta paziņoja 2022. gada oktobrī.

Kas tas ir
Microsoft sauc VALL-E par “neironu kodeku valodas modeli”. Šis mākslīgais intelekts spēj atdarināt jebkuru cilvēka balsi, un tam pietiek noklausīties tikai 3 sekundes no oriģinālās balss. Mākslīgais intelekts sadala informāciju sastāvdaļās un sintezē skaņas variācijas dažādās frāzēs, kā rezultātā tas spēj precīzi atveidot runātāja tembru un emocionālo toni.

1e3e64b34ee601451e83c1c2e41c992c

Lai apmācītu Vall-E, Microsoft izmantoja 60 000 stundu ilgu sarunu ierakstus, ko ierakstījuši vairāk nekā 7000 reālu cilvēku. Lielākā daļa no tām bija audiogrāmatas no LibriVox bibliotēkas.

Vall-E simulēto balsu piemērus var noklausīties GitHub vietnē.

Microsoft apgalvo, ka Vall-E var izmantot kā teksta pārvēršanas balsī rīku, runas rediģēšanas veidu un audio radīšanas sistēmu, apvienojot to ar citiem ģeneratīviem mākslīgajiem intelektiem.

Avots: Vall-E

Jums var arī patikt

Leave a Comment

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?

Šī vietne izmanto sīkfailus, lai uzlabotu jūsu pieredzi. Mēs pieņemam, ka jūs ar to piekrītat, bet jūs varat atteikties, ja vēlaties. Pieņemt Lasīt vairāk

Konfidencialitātes un sīkdatņu politika
-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00

Spelling error report

The following text will be sent to our editors:

BALTIJASZINAS MEDIJU NAMS 2024 Visas tiesības aizsargātas.