Generativna AI je zaokupila maštu javnosti skokom u kreiranje razrađenog, uverljivo stvarnog teksta i slika iz verbalnih zahteva. Ali činjenica je u tome što su rezultati često daleko od savršenih kada pogledate malo bliže.

Sada, Synthesia, jedan je od ambicioznih AI startapova koji rade na video snimcima, posebno prilagođenim avatarima dizajniranim za poslovne korisnike da kreiraju promotivni, trening i drugi poslovni video sadržaj.

Njihova najnovija verzija sadrži avatare napravljene na osnovu stvarnih ljudi snimljenih u njihovom studiju koji pružaju više emocija, bolje praćenje usana i ono što kaže da su izražajniji prirodni i ljudski pokreti kada se napajaju tekstom za generisanje video zapisa.

shutterstock-synthesia-2.jpg
Foto: Shutterstock

Za razliku od drugih generativnih AI igrača kao što je OpenAI, koji je izgradio dvosmernu strategiju podižući ogromnu svest javnosti pomoću potrošačkih alata kao što je ChatGPT, a istovremeno izgrađujući B2B ponudu, sa svojim API-jima koji koriste nezavisni programeri kao i gigantska preduzeća ,Synthesia se oslanja na pristup koji koriste neki drugi istaknuti AI startapi.

Slično fokusu kompanije Perplexity na stvarnom pronalaženju generativnog AI pretraživanja, Synthesia je fokusirana na to da zaista otkrije kako da napravi što je moguće ljudskije generativne video avatare. Tačnije, želi da to uradi samo za poslovno tržište i slučajeve upotrebe kao što su obuka i marketing.

Taj fokus je pomogao Synthesia da se istakne na onome što je postalo veoma pretrpano tržište veštačke inteligencije koje je izloženo riziku da postane komodizovano kada se uzbuđenje smiri na dugoročnije brige kao što su ARR, ekonomija jedinica i operativni troškovi vezani za implementacije AI.

Synthesia opisuje svoje nove Expressive Avatare, kao prvu takve vrste: „Prvi avatari na svetu potpuno generisani pomoću veštačke inteligencije“. Izgrađena na velikim, unapred obučenim modelima, Synthesia kaže da je njen proboj bio u tome kako se kombinuju da bi se postigla multimodalna distribucija koja više oponaša način na koji stvarni ljudi govore.

Oni se stvaraju u hodu, kaže Synthesia, što treba da bude bliže iskustvu kroz koje prolazimo kada govorimo ili reagujemo u životu. Ovo je u suprotnosti sa načinom na koji danas funkcionišu mnogi AI video alati zasnovani na avatarima: obično su to zapravo mnogi delovi videa koji se brzo spajaju zajedno da bi stvorili odgovore lica koji su manje-više usklađeni sa skriptama koje se unose u njih. Cilj je da izgledate manje robotski i realniji.

Uprkos tim izazovima, kompanija je nastavila da raste

Synthesia je poslednji put procenjena na milijardu dolara kada je prikupila 90 miliona dolara. Značajno je da je to prikupljanje sredstava bilo pre skoro godinu dana, u junu 2023.

Pre lansiranja nove verzije, oko 200.000 ljudi je kreiralo više od 18 miliona video prezentacija na oko 130 jezika koristeći 225 zastarelih avatara Synthesia, saopštila je kompanija. Nada startap-a je, naravno, da je to da sa izbacivanjem nove verzije, ti brojevi će još više rasti.