DeepMind otkrio Genie 2: Model koji omogućava brzu izradu 3D svetova za igre
DeepMind, Google-ova istraživačka organizacija za veštačku inteligenciju, otkriva model koji može generisati "beskrajnu" raznolikost igrivih 3D svetova.
DeepMind, istraživački ogranak kompanije Google za veštačku inteligenciju, predstavio je model pod nazivom Genie 2, koji je u stanju da generiše interaktivne, realistične scene iz jedne slike i tekstualnog opisa, poput “simpatičan humanoidni robot u šumi”. Kao naslednik ranije predstavljenog modela Genie, Genie 2 se pridružuje trci sa sličnim projektima kompanija kao što su World Labs Fei-Fei Li i izraelski startap Decart.
Kompanija tvrdi da Genie 2 može generisati “ogromnu raznolikost bogatih 3D svetova”, uključujući i one u kojima korisnici mogu izvoditi akcije poput skakanja i plivanja koristeći miš ili tastaturu. Trenirana na video zapisima, ova veštačka inteligencija može simulirati interakcije objekata, animacije, osvetljenje, fiziku, refleksije i ponašanje “NPC” likova (likova koje ne kontroliše igrač).
Mnoge simulacije koje pruža Genie 2 izgledaju poput visokobudžetnih video igara, što može biti posledica činjenice da su podaci za obuku uključivali snimke igranja popularnih naslova. Ipak, DeepMind, kao i mnoge AI laboratorije, nije otkrio detalje o metodama prikupljanja podataka, bilo iz konkurentskih razloga ili drugih.
Pitanje intelektualne svojine takođe se nameće. Kao Googleova podružnica, DeepMind ima neograničen pristup YouTube-u, a Google je ranije nagovestio da mu uslovi korišćenja omogućavaju da koristi YouTube video zapise za obuku modela. Međutim, ostaje otvoreno da li Genie 2 praktično stvara neovlašćene kopije video igara koje je “gledao”, što bi moglo biti predmet pravnih sporova.
DeepMind navodi da Genie 2 može generisati konzistentne svetove iz različitih perspektiva, poput pogleda iz prvog lica ili izometrijskog prikaza, u trajanju do jednog minuta, pri čemu većina scena traje između 10 i 20 sekundi.
“Genie 2 inteligentno reaguje na akcije koje korisnik preduzme pritiskom tastera na tastaturi, identifikujući lik i pravilno ga pomerajući“, navodi se u blog postu kompanije, prenosi TechCrunch. “Na primer, naš model može zaključiti da tasteri sa strelicama treba da pomeraju robota, a ne drveće ili oblake.”
Dok većina modela sličnih Genie 2 tzv. “modela sveta” može simulirati igre i 3D okruženja, često se susreću sa problemima poput artefakata, nedoslednosti i “halucinacija”. Na primer, Decartov Minecraft simulator, Oasis, ima nisku rezoluciju i brzo “zaboravlja” raspored nivoa.
Genie 2, međutim, može zapamtiti delove simulirane scene koji nisu trenutno vidljivi i tačno ih prikazati kada se ponovo pojave u vidokrugu. (Modeli kompanije World Labs takođe poseduju ovu sposobnost.)
Iako igre kreirane uz pomoć Genie 2 ne bi bile naročito zabavne zbog ograničenog trajanja simulacija, DeepMind pozicionira ovaj model kao istraživački i kreativni alat - sredstvo za prototipizaciju “interaktivnih iskustava” i evaluaciju AI agenata.
“Zahvaljujući sposobnosti Genie 2 za generalizaciju izvan distribuiranih podataka, konceptualna umetnost i crteži mogu se pretvoriti u potpuno interaktivna okruženja“, navodi DeepMind. “Koristeći Genie 2 za brzo kreiranje bogatih i raznovrsnih okruženja za AI agente, naši istraživači mogu generisati evaluacione zadatke koje agenti nisu videli tokom obuke.”
Međutim, kreativni profesionalci, posebno u industriji video igara, mogu imati pomešana osećanja. Nedavna istraga magazina Wired otkrila je da velike kompanije poput Activision Blizzard-a, koji je otpustio značajan broj zaposlenih, koriste AI tehnologije kako bi smanjile troškove, povećale produktivnost i nadoknadile fluktuaciju radne snage.
Bez obzira na to, Google intenzivno ulaže u istraživanje “modela sveta”, koji obećavaju da će biti sledeći veliki iskorak u oblasti veštačke inteligencije. U oktobru, DeepMind je angažovao Tima Brooksa, koji je predvodio razvoj OpenAI-jevog generatora videa Sora, da radi na tehnologijama za generisanje videa i simulaciju svetova. Pre dve godine, laboratorija je preuzela Tima Rocktäschela, poznatog po svojim eksperimentima sa “otvorenošću” u video igrama poput NetHack-a, iz kompanije Meta.
Izvor: Benchmark/Kurir/DarkoMulic