NAPREDAK U VEŠTAČKOM GOVORU: Guglova mašina priča kao čovek

Shutterstock

Novi kompjuterski sistem Takotron 2 uvežban je na primerima ljudskog govora kako bi zvučao realistično

Kompanija „Gugl“ otkrila je svoj novi sistem za prebacivanje teksta u govor koji će omogućiti veštačkoj inteligenciji da govori onako kako to rade ljudi.


Alatka nazvana Takotron 2 uvežbana je na primerima ljudskog dijaloga kako bi njen govor bio što realističniji.


Druga generacija


- Takotron 2 je skoro nemoguće razlikovati od ljudskog govora. Reč je o drugoj generaciji tehnologije prebacivanja teksta u govor, a sposobna je da različito čita reči koje se isto pišu a u zavisnosti od konteksta - saopštio je „Gugl“.


Kako se navodi, tehnologija ima dve duboke veštačke nervne mreže. Prva prevodi tekst u spektogram u pdf formatu, što je vizuelni način predstavljanja audio-frekvencija. Taj spektogram se onda ubacuje u Vejv net, sistem iz laboratorije Dip majnd, koja čita tabelu i stvara audio-elemente.


Primeri govora predstavljeni su na internetu i svako ih može poslušati.


Problemi s rečima


- Naš sistem govora zvuči odlično, ali postoji još teškoća na koje nailazimo i koje moramo prevazići. Neke teške reči i dalje umeju da naprave problem i dovode do stvaranja čudnog zvuka - navode tvorci sistema u saopštenju.


Sistem je napravljen tako da govori ženskim glasom. U slučaju da se glas promeni i izabere drugi ženski ili neki muški glas, sistem je potrebno trenirati iz početka.