Novi kompjuterski sistem Takotron 2 uvežban je na primerima ljudskog govora kako bi zvučao realistično
Kompanija „Gugl“ otkrila je svoj novi sistem za prebacivanje teksta u govor koji će omogućiti veštačkoj inteligenciji da govori onako kako to rade ljudi.
Alatka nazvana Takotron 2 uvežbana je na primerima ljudskog dijaloga kako bi njen govor bio što realističniji.
Druga generacija
- Takotron 2 je skoro nemoguće razlikovati od ljudskog govora. Reč je o drugoj generaciji tehnologije prebacivanja teksta u govor, a sposobna je da različito čita reči koje se isto pišu a u zavisnosti od konteksta - saopštio je „Gugl“.
Kako se navodi, tehnologija ima dve duboke veštačke nervne mreže. Prva prevodi tekst u spektogram u pdf formatu, što je vizuelni način predstavljanja audio-frekvencija. Taj spektogram se onda ubacuje u Vejv net, sistem iz laboratorije Dip majnd, koja čita tabelu i stvara audio-elemente.
Primeri govora predstavljeni su na internetu i svako ih može poslušati.
Problemi s rečima
- Naš sistem govora zvuči odlično, ali postoji još teškoća na koje nailazimo i koje moramo prevazići. Neke teške reči i dalje umeju da naprave problem i dovode do stvaranja čudnog zvuka - navode tvorci sistema u saopštenju.
Sistem je napravljen tako da govori ženskim glasom. U slučaju da se glas promeni i izabere drugi ženski ili neki muški glas, sistem je potrebno trenirati iz početka.