potencijalna tužba?

OpenAI možda krši Google pravila i uslove korišćenja: Sora skuplja YouTube video sadržaj ali pitanje je kako?

Sub, 06.04.2024. 11:07h

Foto: printscreen YT

Dobro je poznato da OpenAI skuplja ogromne količine podataka, od kojih su neki zaštićeni autorskim pravima, sa interneta da bi proizveo neverovatno ljudsko iskustvo ChatGPT-a. Zakonitost toga je i dalje živo pitanje, o čemu svedoče tužbe Njujork tajmsa i drugih. Ali kako trenira svoj novi video AI program, Sora?

Ako bi Sora koristila sadržaj sa YouTube-a, to bi predstavljalo „očigledno kršenje“ njegovih uslova korišćenja usluge, rekao je izvršni direktor YouTube-a Nil Mohan.

Mohan je mislio na dugogodišnja pitanja o tome gde kompanije sa veštačkom inteligencijom dobijaju sadržaj koji koriste za obuku modela koji pokreće njihove usluge. Iako je Mohan sigurno rekao da ne zna da li je OpenAI koristio YouTube sadržaj za razvoj Sore, rekao je da bi to bio problem, ako jeste.

„Iz perspektive kreatora, kada kreator postavi svoj naporan rad na našu platformu, oni imaju određena očekivanja“, rekao je Mohan. „Jedno od tih očekivanja je da će uslovi usluge biti poštovani.

Foto: Shutterstock

Nešto poput uklanjanja njihovog sadržaja sa platforme i korišćenja od strane treće strane bilo bi „očigledno kršenje naših [uslova korišćenja usluge]“, rekao je Mohan.

Preuzimanje video zapisa ili transkripata predstavljalo bi kršenje uslova. „To su pravila puta u pogledu sadržaja na našoj platformi“, rekao je Mohan.

Portparol YouTube-a je potvrdio da uslovi korišćenja usluge „zabranjuju neovlašćeno kopiranje ili preuzimanje YouTube sadržaja“.

Foto: Shutterstock

OpenAI je priznao da je koristio podatke zaštićene autorskim pravima za obuku svojih AI modela, rekavši da je „nemoguće“ izgraditi tehnologiju bez njih. Priznanje je proizašlo iz podneska OpenAI koji je podnet britanskom Domu lordova kada je vlada Ujedinjenog Kraljevstva razmatrala novi zakon koji bi ograničio način na koji kompanije sa veštačkom inteligencijom mogu da koriste materijal zaštićen autorskim pravima.

U skorije vreme, lansiranje Sore izazvalo je dalju pažnju kada CTO OpenAI Mira Murati nije mogla da odgovori na pitanje o tome koja vrsta sadržaja je korišćena za obuku programa, a posebno da li je bilo koji sa YouTube-a. „Zapravo nisam sigurna u to“, rekla je Murati za Wall Street Journal.

Murati je zatim dodala da su svi korišćeni podaci javno dostupni ili licencirani. Mohan je nagovestila da bi trebalo da pitaju OpenAI da li je koristio YouTube podatke i kako.

Foto: printscreen YT

Još više komplikuje stvar to što YouTube i Google-ova matična kompanija, Alphabet, razvijaju sopstveni paket AI alata, što čini verovatnijim da je Alphabet još više zabrinut da bi potencijalni rival mogao da koristi njegov sadržaj na način koji krši njegove uslove korišćenja.

„Google želi te podatke za svoje modele“, rekao je za Fortune Igor Jablokov, osnivač i izvršni direktor AI startupa Piron.

Trka u naoružanju veštačke inteligencije već je pokrenula zlatnu groznicu za podacima. Veliki AI igrači kao što su Alphabet, Microsoft, Amazon i Meta želeće da se uvere da rivali ne uzimaju podatke koje su akumulirali. „Svi će oni postaviti ograđene bašte kao uslove“, kaže Jablokov, čiji je prethodni startup za prepoznavanje glasa bio ključan u Amazonovom kasnijem stvaranju Alexa.

Foto: Shutterstock

Na primer, Reddit je nedavno sklopio ugovor o licenciranju od 60 miliona dolara godišnje sa Google-om prema kojem bi se njegov sadržaj koristio za obuku alata za veštačku inteligenciju. Medijske kompanije su takođe sklopile slične ugovore sa programerima veštačke inteligencije. Associated Press ima ugovor sa OpenAI-om koji dozvoljava da se njegove arhive koriste u svrhe obuke. U međuvremenu, nemačka medijska kompanija Axel Springer, koja poseduje Business Insider i Politico, ima sličan ugovor koji takođe daje atribuciju u odgovorima koje daje ChatGPT.