KAKO SLEPI GLEDAJU FOTOGRAFIJE? Veštačka inteligencija ima rešenje za osobe koje ne vide

Shutterstock

Dobijanje detaljnog opisa okruženja i fotografije jednim klikom na pametnom telefonu, koje je do skoro delovalo nezamislivo, danas je moguće zahvaljujući veštačkoj inteligenciji. Besplatni AI alati, dostupni svima za preuzimanje, učinili su da slepe i slabovide osobe lakše pristupaju medijskom sadržaju.

Od lakšeg praćenja medijskog sadržaja, predstava, filmova i serija do modnih saveta i opisa okruženja, osobama koje ne vide veštačka inteligencija otvorila je brojne mogućnosti. Do pre nekoliko godina bio je dostupan samo opis teksta koji su generisali čitači ekrana ugrađeni u računare. Danas su napredniji govorni softveri dostupni na internetu za preuzimanje svima i potpuno su besplatni.

Wicab 
foto: Wicab

Čitači ekrana, kako kaže studentkinja Fakulteta političkih nauka i korisnica asistivne tehnologije Danica Cvetković, na mobilnim telefonima izgovaraju sve što se vidi na ekranu, a nekad čak i opise emotikona. Na računarima se, dodaje Cvetković, mogu skinuti i naprednije verzije koje imaju bolju detekciju elemenata na ekranu.

- Prvi put sam čitač ekrana počela da koristim na laptopu i tada sam bila manje sigurna da li govorni softver zaista čita ono što je prikazano. S druge strane, znala sam manje komandi i prečica - kaže ona.

Kako objašnjava IT stručnjak i član Akademske inkluzivne asocijacije Miloš Selaković, kada osoba koja ne vidi želi da pročita nešto sa ekrana, dovoljno je da dvaput klikne na određeno mesto i govorni softver će to pročitati. Osobe koje su vešte u korišćenju čitača će, kaže Selaković, često i ubrzati glasovni opis ekrana, kako bi lakše pročitale tekst u nekom mediju, pristupile određenom sajtu ili pak poslale SMS poruku.

Postoje, kako dodaje, komande koje bi mogle funkcionisati na bolji način, a kao primer navodi robotski glas, koji nije dovoljno prirodan, što nekim korisnicima može da zasmeta.

Opis sadržaja na fotografijama

Do sada je, kažu sagovornici, kod korišćenja čitača problematična bila pojava šumova prilikom pristupanja fotofrafijama, odnosno nemogućnost čitača da audioopiše fotografiju. Stvari je promenio nagli razvoj veštačke inteligencije, pa brojni AI alati korišćenjem algoritama za analizu slika i opcija za proizvodnju tekstualnih i audio opisaomogućuju slepim osobama da razumeju šta se nalazi na fotografijama.

Takve su aplikacije kao što je Microsoft Seeing AI, Google Lookout, TapTapSee. Telefoni sa ugrađenim programom OCR imaju mogućnost da slepim i slabovidim osobama pročitaju tekstualni sadržaj ispisan na fotografiji.

Kao korisnu za opis vizuelnog sadržaja na internetu, ali i fizičkog okruženja, Danica Cvetković i Miloš Selaković istakli su aplikaciju Be my eyes. Sa ovom kompanijom sarađuju brojni operateri koji slepim i slabovidim osobama na maternjem jeziku opisuju i objašnjavaju šta se nalazi u njihovom okruženju.

Dovoljan je jedan klik za poziv, a centrala korisnika povezuje sa operaterom za manje od pola minuta. Da bi neko postao volonter, dovoljno je da se prijavi putem aplikacije, a pozive može prihvatiti kad god želi.

Volonterka Be my eyes Marina Đurović kaže da je prvi poziv dobila kako bi dala modni savet ženi koja ne vidi.

- Najpre sam se zbunila jer nisam znala da li uopšte postoji potreba za ovom alikacijom na našem govornom području. Zbog toga sam se javila kao da pričam engleski i gospođa sa druge strane je pitala "Speak Serbian?" Tada me je pitala da li su pantalone koje je probala odgovarajuće dužine za svečanu priliku - navela je ona.

Shutterstock 
foto: Shutterstock

Strahovala je, kako kaže, zbog mogućnosti da neće biti u stanju da pruži odgovarajuću podršku svakom korisniku. Međutim, nakon toga, stizali su drugi upiti, na koje je uspešno odgovarala.

- Sećam se gospodina koji me je pozvao da mu pomognem da pronađe frizerski salon u koji se uputio. On je šetao i držao telefon, a ja sam mu čitala nazive lokala sve dok nije došao do salona. Drugi gospodin me je pitao da mu pročitam specifikaciju proizvoda. Pozvala je i gospođa koja je kuvala ručak, pa me je pitala da joj pročitam za koliko će biti gotov - rekla je ona.

Za razliku od njih, Danica Cvetković, koja sebe smatra introvertnom osobom, opredelila se za opciju "Be my AI". U okviru ove opcije aplikacija "Be my eyes" uz pomoć veštačke inteligencije generiše opis onoga što je na fotografiji.

- Pošto sam zatvorenija osoba, nije mi bilo toliko prijatno da na video pozivu komuniciram sa osobom koju ne poznajem. Zato me je obradovalo kada je kompanija uvela veštačku inteligenciju u aplikaciju i omogućila da se dobije tekstualni opis nečega što fotografišemo, a da nam zatim taj opis govorni softver pročita - rekla je Cvetković.

Kako kaže, ova opcija joj je komfornija za korišćenje.

- Naravno, videći volonteri su nezamenljivi, zato što AI ne može uvek pružiti odgovarajuću pomoć i njene odgovore treba uzeti sa rezervom - ističe ona.

Cvetković dodaje da aplikacija daje opis na jeziku koji je odabran kao podrazumevani na telefonu, a moguće je dobiti i dodatne informacije pomoću opcije "Ask more".

Nove opcije za one koji ne vide

Kako razvoj veštačke inteligencije stalno omogućava nove opcije za osobe koje ne vide, Miloš Selaković smatra da će ona uskoro moći da generiše audio deskripciju u realnom vremenu.

- Netfliks i HBO platforme poseduju audio deskripciju koja se može uključiti i isključiti. U ovim kompanijama postoje ljudi koji su plaćeni da opisuju vizuelni sadržaj, odnosno scene koje su između dijaloga. Ima malo domaćih TV serija sa audio deskripcijom, pa smo uskraćeni za domaći sadržaj. Verujem da će veštačka inteligencija u budućnosti moći da opisuje te scene i da za to neće morati da se plaćaju ljudi, već će sve to moći da bude generisano uz pomoć AI alata - kaže Selaković.

Iako je veštačka inteligencija u ranoj fazi napretka, njen razvoj iznedrio je dosad nezamislive mogućnosti za prilagođavanje multimedijalnog sadržaja osobama koje ne vide i ne čuju. Ako se napredak nastavi ovim tokom, osobe sa ovim senzornim invaliditetom moći će bez problema da prate medijski sadržaj, serije, filmove i predstave u isto vreme kao i ostatak auditorijuma, uz pomoć veštačke inteligencije.

Kurir.rs/ UNS/ S.Đ.

Bonus video:

This browser does not support the video element.

03:33
SLEPI ADVOKAT IZ NIŠA ZA KURIR TV: Ništa mi nije teško, rešio sam situaciju u glavi i sada mi je sve zabano!  Izvor: kurir tbv