OpenAI možda krši Google pravila i uslove korišćenja: Sora skuplja YouTube video sadržaj ali pitanje je kako?

printscreen YT

Dobro je poznato da OpenAI skuplja ogromne količine podataka, od kojih su neki zaštićeni autorskim pravima, sa interneta da bi proizveo neverovatno ljudsko iskustvo ChatGPT-a. Zakonitost toga je i dalje živo pitanje, o čemu svedoče tužbe Njujork tajmsa i drugih. Ali kako trenira svoj novi video AI program, Sora?

Ako bi Sora koristila sadržaj sa YouTube-a, to bi predstavljalo „očigledno kršenje“ njegovih uslova korišćenja usluge, rekao je izvršni direktor YouTube-a Nil Mohan.

Mohan je mislio na dugogodišnja pitanja o tome gde kompanije sa veštačkom inteligencijom dobijaju sadržaj koji koriste za obuku modela koji pokreće njihove usluge. Iako je Mohan sigurno rekao da ne zna da li je OpenAI koristio YouTube sadržaj za razvoj Sore, rekao je da bi to bio problem, ako jeste.

„Iz perspektive kreatora, kada kreator postavi svoj naporan rad na našu platformu, oni imaju određena očekivanja“, rekao je Mohan. „Jedno od tih očekivanja je da će uslovi usluge biti poštovani.

Shutterstock 
foto: Shutterstock

Nešto poput uklanjanja njihovog sadržaja sa platforme i korišćenja od strane treće strane bilo bi „očigledno kršenje naših [uslova korišćenja usluge]“, rekao je Mohan.

Preuzimanje video zapisa ili transkripata predstavljalo bi kršenje uslova. „To su pravila puta u pogledu sadržaja na našoj platformi“, rekao je Mohan.

Portparol YouTube-a je potvrdio da uslovi korišćenja usluge „zabranjuju neovlašćeno kopiranje ili preuzimanje YouTube sadržaja“.

Shutterstock 
foto: Shutterstock

OpenAI je priznao da je koristio podatke zaštićene autorskim pravima za obuku svojih AI modela, rekavši da je „nemoguće“ izgraditi tehnologiju bez njih. Priznanje je proizašlo iz podneska OpenAI koji je podnet britanskom Domu lordova kada je vlada Ujedinjenog Kraljevstva razmatrala novi zakon koji bi ograničio način na koji kompanije sa veštačkom inteligencijom mogu da koriste materijal zaštićen autorskim pravima.

U skorije vreme, lansiranje Sore izazvalo je dalju pažnju kada CTO OpenAI Mira Murati nije mogla da odgovori na pitanje o tome koja vrsta sadržaja je korišćena za obuku programa, a posebno da li je bilo koji sa YouTube-a. „Zapravo nisam sigurna u to“, rekla je Murati za Wall Street Journal.

Murati je zatim dodala da su svi korišćeni podaci javno dostupni ili licencirani. Mohan je nagovestila da bi trebalo da pitaju OpenAI da li je koristio YouTube podatke i kako.

printscreen YT 
foto: Printscreen YT

Još više komplikuje stvar to što YouTube i Google-ova matična kompanija, Alphabet, razvijaju sopstveni paket AI alata, što čini verovatnijim da je Alphabet još više zabrinut da bi potencijalni rival mogao da koristi njegov sadržaj na način koji krši njegove uslove korišćenja.

„Google želi te podatke za svoje modele“, rekao je za Fortune Igor Jablokov, osnivač i izvršni direktor AI startupa Piron.

Trka u naoružanju veštačke inteligencije već je pokrenula zlatnu groznicu za podacima. Veliki AI igrači kao što su Alphabet, Microsoft, Amazon i Meta želeće da se uvere da rivali ne uzimaju podatke koje su akumulirali. „Svi će oni postaviti ograđene bašte kao uslove“, kaže Jablokov, čiji je prethodni startup za prepoznavanje glasa bio ključan u Amazonovom kasnijem stvaranju Alexa.

Shutterstock 
foto: Shutterstock

Na primer, Reddit je nedavno sklopio ugovor o licenciranju od 60 miliona dolara godišnje sa Google-om prema kojem bi se njegov sadržaj koristio za obuku alata za veštačku inteligenciju. Medijske kompanije su takođe sklopile slične ugovore sa programerima veštačke inteligencije. Associated Press ima ugovor sa OpenAI-om koji dozvoljava da se njegove arhive koriste u svrhe obuke. U međuvremenu, nemačka medijska kompanija Axel Springer, koja poseduje Business Insider i Politico, ima sličan ugovor koji takođe daje atribuciju u odgovorima koje daje ChatGPT.