Di l’arte di fasi capisce dà l’urdinatore

Common Voice hè l’iniziativa di Mozilla per aiutà à insegnà à e macchine cume parlanu in vere e parsone.
U prughjettu Common Voice hè l’iniziativa di Mozilla pà custruisce una basa di dati di voce cù è teste currespundente, cù u scopu di mette in piazza un sistemu di ricuniscenza vucale. In a filusufia d’apertura è di cummunità di Mozilla, issu prughjettu hè sustentatu dà è so utilizatori, è u so prughjettu di traduzzione in Corsu hè stata aghjustatu da pocu.

Dapoi a qualchi anni (Hè stata teurizata in l’anni 40, mà l’urdinatore un erani micca abbastanza putenti nanza) una technulugia fà parlà d’edda di più in più : u « machine learning » (l’Amparera dà una Macchina).
Cù una structura chjamata reta neuronala, hè pussibule di spiecà à un urdinature comu solve prublemi assai cumplicati, astratti ancu per noi (comu ricunnosce un artistu ? comu creà una musica ?) chi
sariani guasgi impussibule di manera alguritmica tradiziunale, è inferiori à u niveddu di l’efficacità (comu u prublemu di a ricuniscenze di faccie) à a cundizione ch’avemu abbastanze dati classificati :
E quì hè a radica di u prublemu, pà esse efficiente, una reta neurala hà bisogna di mori di dati, è ancu megliu di dati limpiati, classificati (es. se vulemu amparà à ricunisce un pettirossu – avemu bisognu di fiure di pettirosse, di fiure di micca-pettirosse, tutti marcati)
Nurmalamente, cì sò prufessionale chi ghjuvani basi di dati (è CAPTCHA; issi dumande ch’un urdinatore un pò micca solve ghjuvani à custituisce issi basi di dati ) prudutti è limpiati cù mori di travaddu dà altri imprese…. Tuttu issu travaddu è fastidiosu, costu mori di soldi, è ùn saria micca accessìbile pà è lingue più chjuche.

E quì ghjunghje Mozilla cù u so sistemu di crowd-sourcing (sparte una tacca trà mori di ghjenti) di u travaddu : una cummunità di vulintarii poni travaddà inseme pà custruisce è nittà issa basa di dati trà elli, cù un sistemu di votu pà validà l’estratti di voce.
Senza nissuna ubligazione di regularità dà i cuntributori, u prughjettu hà dighjà dispunibule in mori lingue, à ancu altre lingue cù pochi locutori (u komi-zyrian, l’erza,…).
Issa plataforma sarà missa in piazza in duie volte; primu, à traduzzione dighjà principiata di u situ web annantu à pontoon (avemu bisognu di voi) induve ci vulerà à righjistrassi pà participà, è dopu,
l’arrighjistramentu di è voce, chi pò esse fattu senza palisassi ò arrighjistrassi.

V’invitemu à participà dà oghje.

Lasciate un cummentu ?

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.