Tehnologia de imitare a vocii care poate păcăli sistemele de recunoaștere vocală
O companie din China a creat o tehnologie care poate imita atât de bine o voce umană încât poate păcălii software-ul de recunoaștere a vocii în 95% dintre cazuri.
Baidu, compania care a creat această tehnologie, spune că poate fi folosită pentru a creea asistenți digitali și servicii de traducere automate, scrie dalymail.co.uk.
La început, compania folosea tehnica de învățare Deep Voice pentru a transforma textele scrise în text citit de o voce.
Deși tehnologia de copiere a vocii ar putea fi amuzantă are și implicații serioase în ceea ce privește securitatea, deoarece cei care o folosesc ar pute să se dea drept altcineva.
Sistemul de sintetizare a vocii, numit Deep Voice, a fost antrenat folosind mai mult de 800 de ore de înregistrări audio de la aproximativ 2.400 de vorbitori. Acum, sistemul necesită 100 de înregistrări de cinci secunde pentru imitarea unei voci și poate păcăli un sistem de recunoaștere a vocii 95% din timp.
Dezvoltatorii tehnologiei spun că aceasta ar putea reda vocea persoanelor care nu mai pot vorbi. Copiii pot asculta povestile preferate citite cu vocea părinților. De asemenea, Deep Voice poate reda vocea cu un alt accent sau o poate face să sune ca și cum ar aparține sexului opus.
Astfel, cercetătorii Baidu susțin că au creat un program pe bază de inteligență artificială care poate mima cu acuratețe vocea cuiva pe baza unei înregistrări mai scurte de un minut, scrie digitaltrends.com.
Ceea ce este important în progresul celor de la Baidu este timpul necesar pentru tehnologie pentru a învăța să mimeze vocea. Baidu nu este singura companie care a încercat reproducerea vocii. În 2017, proiectul Lyrebird a apărut. Folosește modelul rețelelor neuronale pentru reproduce vocile, inclusiv cea a lui Donald Trump cu relativ câteva înregistrări.
Conform celor de la Digital Trends, sinteza vocii realizată de cei de la Baidu nu sună a fi complet convingătoare, dar este un pas mare în ceea ce privește vocile roboților.
De asemenea, Digital Trends reamintește de tenologia care folosește inteligența artificială pentru a suprapune fața cuiva deasupra corpului unei alte persoane, de multe ori folosită în creearea de filme.