Deep Dream, Kako Nas Vide Kompjuteri

Čovječanstvo je kroz svoju bogatu i često nepredvidivu povijest utrošilo mnogo energije, resursa i inteligencije da bi pretpostavljalo kako bi budućnost mogla izgledati. Vizualizirale su se razne forme tehnološkog društva, kreirale uvjerljive slike robota i brojne vizije kompjuterskih svjetova. Simulirani su razni modeli, spekulirani su brojni scenariji, snimani su filmovi, pisane knjige, crtale su se i projektirale nove civilizacije nastale na napretku tehnologija kompjutera i progresu robotike. Tek nedavno, na zaprepaštenje mnogih, uvođenjem programa Deep Dream u svakodnevnu upotrebu, mogli smo vidjeti kako ona druga strana vidi nas ljude, kako kompjuteri, roboti i visoka tehnologija vidi naš svijet, slike i motive svijeta oko nas.

Deep Dream je program koji je zapravo sve razotkrio, precizno pojasnio i slikovito pokazao kako nas vide strojevi i umjetna inteligencija. Deep Dream je pomno i dugotrajno razvijani program “računalnog vida” koji je osmislio Google, s ciljem olakšavanja i poboljšavanja uvjeta u pronalaženju slika. Traženje slika prema nazivima ili drugim kodnim atributima pokazalo se vremenom potpuno neučinkovito te je ubrzo shvaćeno da je potrebno napraviti softver koji prepoznaje karakteristične slike putem velike baze poznatih lica i motiva. Deep Dream potječe iz duboke konvolucijske neuronske mreže za prepoznavanje objekata kodnog imena „Inception“, a razvijen je za ImageNet-ov program vizualnog prepoznavanja ILSVRC objavljenom u srpnju 2015. godine. Softver je dizajniran za prepoznavanje lica i drugih uzoraka s ciljem automatske klasifikacije slika.

deep dream turato

Kada je program postao dostupan za javnu upotrebu, brojni korisnici softvera ostali su zaprepašteni činjenicom da bilo koji motiv, sliku ili prizor koju kompjuter pregledava u startu vidi kao mnoštvo psećih glava. Pseće oči, uši i njuške počele su se pojavljivati unutar neočekivanih halucinogenih slika i morfanih oblika. Pseće glave ulazile su u sve motive, dubinski se umnožavale bez obzira na to je li se na slici nalazila hrana, kuća, pejzaž ili neka naša draga osoba. Sličnost između motiva koji nastaju prilikom halucinacija uzrokovanog LSD-jem i psilocibinski induciranim halucinacijama upućuje nas na funkcionalnu sličnost između funkcioniranja i rada umjetno generiranih neuronskih mreža, algoritma kompjutera i određenih slojeva vizualnog korteksa u ljudskom mozgu.

Deep Dream zapravo radi i funkcionira slično procesima ljudskog mozga. Napredna neuronska mreža povezana je u seriju čipova, od kojih svaki igra ulogu neurona u našem mozgu. Čipovi su postavljeni na bazi podataka milijuna fotografija, te se neki od tih neurona pokreću u trenutku kada skeniraju određenu sliku te u njoj „vide“ nešto što jasno prepoznaju. Kada se mrežu informira nekom novom nepoznatom slikom, ona nastoji stvoriti smisao te nove slike u kontekstu onoga što već znade, prepoznaje, odnosno onoga što je već posjeduje u bogatoj banci slika i foto podataka.

Program Deep dream potiče svoj algoritam kako bi stvorio sliku onoga što „misli“ da vidi i vraća sliku ponovno u input na ponovno gledanje i doradu. To je kao da netko od vas traži da nacrtate ono što mislite da vidite u slici oblaka ili zvijezda na nebu, a odmah nakon tog prvog crtanja, pogledate crtež i tada ponovo nacrtate ono što sada mislite da vidite. Ovisno o predhodnom znanju, ovisno o iskustvu rezultati su ili prekrasne slike ili čudovišne noćne more. Nastaju slike koje se slikaju unutar sebe same, slažući i preklapajući motive koje nam se čini da vidimo. Slike se sklapaju od svih poznatih slika i motiva koje postoje u velikoj zbirci podataka – bazi podataka, bazi slika koje smo predhodno pohranili i precizno opisali.

Program Deep Dream koji je osnovni motor i pokretač rada Googleovog Image Neta, koji brojni korisnici pametnih telefona danas koriste, iniciran je strane računalnih znanstvenika na Stanfordu i Princetonu 2007. godine. Znanstvenici su u nekoliko godina od početka rada na programu izradili bazu podataka od 14 milijuna slika koje prikazuju konkretne ljude. Svake godine, ImageNet zapošljavao je 20 do 30 tisuća ljudi, studenata i freelancera na skupljanju slika. Također Image Net je organizirao test-kviz natjecanja gdje je tijekom 2012. godine zadatak bio prepoznavanje raznih životinja, dok je bonus zadatak bio „kvalitetna klasifikacija na 120 vrsta pasa“. Dakle, podaci koji su dani natjecateljskim timovima i koji su kasnije bili upotrebljeni za Deep Dream, imali su bazu punu psećih slika.

Razlog zašto i dan danas gotovo svaka slika Deep Dream-a sadrži mnoštvo psećih očiju, je banalna i trivijalna spoznaja da su psi najčešće fotografirana bića, te da u bazama podataka pasa i njihovih slika ima najviše. Drugim riječima, Googleov Deep Dream posvuda vidi pse jer je doslovce “treniran” da prvo što vidi – su psi svih vrsta i rasa. I danas kada Deep Dream počinje gledati bilo koju sliku, osobu ili motiv, on prvo vidi čovjekovog najboljeg prijatelja, psa. Bilo da smo u program za prepoznavanje stavili pizzu, pornografiju, ženu, kuću, katedralu, morsku pučinu, park ili šumu pseće oči, pseće njuške gledaju sa svih strana tražeći poznate i prepoznatljive motive. Kao i sa svim velikim otkrićima, jako jednostavno, samo na prvi pogled zabrinjavajuće nepoznato.