Slušaj vest

Prethodno su korisnici ChatGPT-a morali da se oslanjaju na različite modele za različite zadatke, GPT za tekst i DALL·E 3 za kreiranje slika. Međutim, sa GPT-4o, OpenAI konsoliduje ove funkcije u jedan, ujedinjen sistem.

shutterstock-chatgpt.jpg
Foto: Shutterstock

Sada korisnici mogu generisati složene slike, informisane tekstualnim promptima ili postavljenim vizualima, sve unutar istog interfejsa. Ovo predstavlja veliki iskorak u svetu kreativnog AI-a, omogućavajući besprekornu, multi-modalnu interakciju.

Od kada je DALL·E 3 lansiran u septembru 2023. godine, AI-generisane slike su osvojile svet umetnosti. Ipak, s pojavom snažnih alternativa poput MidJourney v6 i Stable Diffusion 3.5, OpenAI je odlučio da pristupi novom modelu. GPT-4o je pozicioniran da postepeno ukine DALL·E 3 kao samostalan alat, spajajući najbolje od oba sveta u moćniji paket.

DALL·E  (1).jpg
Foto: Shutterstock

Majstorstvo AI-a: Preciznost u kreiranju

U nedavnom blog postu, OpenAI je pohvalio sposobnost GPT-4o da generiše detaljne, kontekstualno osvežene slike. Model odlično prati složene promptove, koristeći prethodne razgovore i postavljene slike za dodatnu kreativnost. Sem Altman, CEO OpenAI-a, prikazao je svestranost modela kroz primere poput stripova koji objašnjavaju Einsteinovu teoriju relativiteta, personalizovanih kolekcionarskih kartica pravljenih od korisničkih fotografija i detaljnih komemorativnih kovanica, sve stvoreno sa zapanjujućim realizmom.

Izvanredna sposobnost AI-a da stvori čak i najsloženije slike iz opširnih opisa još jednom pokazuje napredne sposobnosti GPT-4o, čime se dodatno učvršćuje njegov položaj kao neophodnog alata u kreativnom svetu.

DALL·E  (2).jpg
Foto: Shutterstock

Vizuelna revolucija sa kreacijom u realnom vremenu

Iako je tehnološki iskorak GPT-4o impresivan, nije bez nedostataka. Novi model generiše slike sporije od svog prethodnika, DALL·E 3. Međutim, OpenAI tvrdi da značajna poboljšanja u vizualnom kvalitetu opravdavaju manji kašnjenje.

U značajnoj odluci dizajna, GPT-4o sada generiše slike progresivno, kreirajući ih od vrha prema dnu. Ovo korisnicima omogućava jedinstveno iskustvo gledanja kako se njihova kreacija razvija u realnom vremenu.

ChatGPT (1).jpg
Foto: Shutterstock

Izvan umetnosti

Ali uticaj GPT-4o nije ograničen samo na umetnost. Sposobnosti modela proširuju se na oblasti kao što je obrazovanje, gde može generisati složene dijagrame i ilustrativni sadržaj za akademske svrhe. Bilo da se radi o vizuelnoj pomoći za naučni pojam ili prilagođenom obrazovnom plakatu, preciznost GPT-4o otvara nove mogućnosti za interaktivno učenje.

Pored toga, GPT-4o omogućava korisnicima da edituju slike, održavajući doslednost stila, tona i sadržaja, što ga čini nezamenjivim alatom za dizajnere, marketinške stručnjake i kreativne profesionalce.

ChatGPT (4).jpg
ChatGPT Foto: Shutterstock

Sigurnost i etika

Kako bi rešio zabrinutosti u vezi sa deepfake-ovima, ilegalnim slikama i pokušajima uklanjanja vodenih žigova, OpenAI je implementirao snažnu zaštitu. Generisane slike su uvezene sa C2PA metapodacima, koji osiguravaju transparentnost u vezi sa njihovim AI poreklom, čak iako same slike nemaju vidljive oznake.

Kao deo svog opredeljenja za etičku upotrebu AI-a, OpenAI takođe razvija alate za praćenje nastanka i distribucije AI-generisanih slika, pomažući korisnicima da održavaju odgovornu upotrebu.

ChatGPT (3).jpg
Foto: Shutterstock

Šta sledeće?

Gledajući unapred, OpenAI planira da izda funkciju generisanja slika putem API-ja, omogućavajući programerima da je integrišu u svoje vlastite aplikacije. Prema uslovima korišćenja OpenAI-a, korisnici zadržavaju potpuno vlasništvo nad slikama koje generišu, pod uslovom da poštuju politike kompanije.

Integracijom GPT-4o, OpenAI je uneo monumentalnu promenu u način na koji komuniciramo sa mašinama. GPT-4o nije samo u stanju da razume zahteve, sada može da ih prenese u vizualne remek-dela. Ovaj napredak ne samo da obogaćuje kreativne procese, već redefiniše odnos između ljudi i AI-a, otvarajući beskrajne mogućnosti za budućnost.