Home » Meta ieviesa datu kopu, kas ļaus apmācīt runas atpazīšanas sistēmas skaļruņu “klasteros”.

Meta ieviesa datu kopu, kas ļaus apmācīt runas atpazīšanas sistēmas skaļruņu “klasteros”.

no ANDREJS BOJKO
0 Komentāri Ziedot

Meta AI ir atklājusi jaunu datu kopu, kas sola uzlabot automātiskās runas atpazīšanas (ASR) rīku veiktspēju, klasterējot skaļruņus.

Kas ir zināms

Daudzas datu kopas, ko izmanto, lai apmācītu ASR modeļus, ir sakārtotas pēc demogrāfijas: vecuma grupa, dzimums, tautība, angļu valodas akcents. Tas ierobežo izrunas mainīgumu, uz kura tiek apmācīti algoritmi, un neļauj tos saprast plašam lietotāju lokam.

Lai apietu šo problēmu, Meta AI ir izstrādājis datu kopu, kas balstās uz izteikumu klasterizācijas metodi. Katrā klasterī ir līdzīga frāžu kopa no dažādiem runātājiem. Tas nozīmē, ka ASR modelis iemācīsies atpazīt vienu un to pašu apgalvojumu no dažādiem cilvēkiem.

Iegūtajā Meta datu kopā ir nedaudz vairāk nekā 27 000 komandu paziņojumu, kas savākti no 595 ASV brīvprātīgajiem. Viņu frāzes koncentrējas uz septiņām galvenajām tēmām: mūzika, šaušana, utilītas, paziņojumu pārvaldība, ziņojumapmaiņa, zvanīšana un diktēšana. 

Kā mudināti, diktoriem tika uzdoti jautājumi par to, kā viņi veiks dziesmas meklēšanu ar balsi vai plāno ar draugiem.

Datu kopas testēšanas rezultāti bija daudzsološi, un modeļa veiktspēja uzlabojās  “visām demogrāfiskajām grupām [..], lai gan lielākos ieguvumus sniedza pastiprināta akcentu izmantošana”,  teikts emuārā. 

Kopumā, izmantojot klasterizācijas metodi, ASR veiktspēja palielinājās par 10%. Tajā pašā laikā ievērojams pieaugums tika sasniegts arī 66-85 gadus veco cilvēku grupā, kas tradicionāli ir nepietiekami pārstāvēta balss komandu telpā.

Avots: MetaAI .

Jums var arī patikt

Leave a Comment

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?

Šī vietne izmanto sīkfailus, lai uzlabotu jūsu pieredzi. Mēs pieņemam, ka jūs ar to piekrītat, bet jūs varat atteikties, ja vēlaties. Pieņemt Lasīt vairāk

Konfidencialitātes un sīkdatņu politika
-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00

Spelling error report

The following text will be sent to our editors:

BALTIJASZINAS MEDIJU NAMS 2024 Visas tiesības aizsargātas.