Di l’arte di fassi capisce da l’urdinatore

Common Voice hè l’iniziativa di Mozilla per aiutà à insegnà à e macchine cume parlanu in veru e parsone.
U prughjettu Common Voice hè l’iniziativa di Mozilla pè custruisce una basa di dati di voce cù e teste currespundente, cù u scopu di mette in piazza un sistemu di ricuniscenza vucale. In a filusufia d’apertura è di cummunità di Mozilla, issu prughjettu hè sustentatu dà i so utilizatori, è u so prughjettu di traduzzione in Corsu hè statu aghjustatu da pocu.

Dapoi a qualchi anni (hè stata teurizata in l’anni 40, mà l’urdinatore un erani micca abbastanza putenti nanzu) una technulugia fà parlà d’ella di più in più : u “machine learning” (l’amparera da una macchina).
Cù una struttura chjamata reta neuronale, hè pussibule di spiecà à un urdinatore comu solve prublemi assai cumplicati, astratti ancu per noi (comu ricunnosce un artistu ? comu creà una musica ?) chì sariani guasgi impussibule di manera alguritmica tradiziunale, è inferiori à u niveddu di l’efficacità (comu u prublemu di a ricuniscenze di faccie) à a cundizione ch’avemu abbastanza dati classificati :
È quì hè a radica di u prublemu, pè esse efficiente, una reta neuronale hà bisognu di mori di dati, è ancu megliu di dati limpiati, classificati (es. se vulemu amparà à ricunosce un pettirossu – avemu bisognu di fiure di pettirossi, di fiure di micca-pettirossi, tutti marcati).
Nurmalamente, cì sò prufessionali chì si ghjovani di basi di dati (e CAPTCHA; isse dumande ch’un urdinatore un pò micca solve ghjovani à custituisce issi basi di dati ) prudutti è limpiati cù mori di travagliu da altre imprese… Tuttu issu travagliu hè fastidiosu, costa mori di soldi, è ùn seria micca accessibule pè e lingue più chjuche.

È quì ghjunghje Mozilla cù u so sistemu di crowd-sourcing (sparte una tacca trà mori di ghjenti) di u travagliu : una cummunità di vulintarii poni travaglià inseme pè custruisce è nittà issa basa di dati trà elli, cù un sistemu di votu pè validà l’estratti di voce.
Senza nissuna ubligazione di regularità dà i cuntributori, u prughjettu hè dighjà dispunibule in mori lingue, è ancu altre lingue cù pochi locutori (u komi-zyrian, l’erza,…).
Issa piattaforma sarà missa in piazza in duie volte; primu, à traduzzione dighjà principiata di u situ web annantu à pontoon (avemu bisognu di voi) induve ci vulerà à righjistrassi pè participà, è dopu, l’arrighjistramentu di e voce, chi pò esse fattu senza palisassi ò arrighjistrassi.

V’invitemu à participà da oghje.

Lasciate un cummentu ?

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.