DATA - Internet ogledalo specijalno izdanje IO 191 DATA SPECIJAL - Page 46
alat će najviše koristi doneti Data
Scientistima, ali s obzirom da Wat-
son Studio omogućava da se kom-
pleksne manipulacije velikim koli-
činama podataka odrade veoma
jednostavno, tačnije da se kroz je-
dinstveni i jednostavni drag&drop
Web korisnički interfejs omogući
veoma velika sloboda kreacije i
nekome ko ne vlada veštinama pro-
gramiranja, skriptinga, modeliranja
podataka, dizajna vizuelizacija itd, i
osobe bez takvih predznanja mogu
koristiti Watson Studio.
Kratak uvod u mogućnosti Watson
Studio platforme možete videti na
video zapisu ispod:
ciju da počinjemo da se bavimo online
kreditima (bilo da smo neka postojeća
banka ili, recimo, fintech startup) i
da želimo da od jednog od najboljih
naučimo kako se to radi, tj. šta sve tre-
ba uzeti u obzir prilikom evaluacije
kreditne aplikacije (koji parametri i koji
algoritam odlučivanja), da se ne bismo
izložili nepotrebnom riziku gubitaka
u poslovanju usled tzv. „loših kredita”
(kredita koji neće biti vraćeni).
Na web stranici online loan provaj-
dera možemo pronaći set podataka
o kreditnim aplikacijama i krajnji re-
zultat svake kreditne aplikacije - da li
je kredit odobren i, ako jeste, kolika
je bila zarada samog provajdera po
kriterijuma vezanih za donošenje o-
dluke o odobravanju online kredi-
ta (koji su parametri bitniji za povo-
ljan ishod), a zatim te podatke treba
iskoristiti za kreiranje dva ML mode-
la koja će u našoj budućoj aplikaciji
putem REST API-ja odgovoriti na sle-
deća dva pitanja:
● Da li ovu konkretnu prijavu za
kredit (sa konkretnim podacima ve-
zanim za traženi kredit i podacima o
kreditnom statusu korisnika koji traži
kredit) treba da odobrimo ili ne?
● Ukoliko odobrimo ovu konkretnu
prijavu, kolika će biti naša zarada po
ovom kreditu?
U nastavku ćemo ukratko objasni-
ti pojedine faze procesa dolaženja do
rešenja opisanog iznad, uz osnovni
pregled funkcionalne celine Watson
Studio platforme koja se koristi u toj
fazi. Ideja ovog članka nije da pred-
stavlja detaljni „korak po korak” tuto-
rijal za navedeni scenario, ali na kra-
ju članka ćemo navesti izvore (online
dokumentaciju, video materijale i tu-
torijale) koji vam mogu pomoći u sti-
canju znanja za uspešno ovladavanje
Watson Studio alatima.
Dobavljanje
podataka
Zamislite sledeći scenario:
Za vaš prvi korak u svetu AI-a odabrali
smo jedan lakši primer. Prva stvar koju
ćemo danas pokušati da dešifrujemo
jeste - znanje. U ovom slučaju to će
biti znanje jednog online loan provaj-
dera, koje je „sakriveno” u javno obja-
vljenim podacima, a koji sadrže infor-
macije o preko 40.000 online kreditnih
aplikacija koje su oni obradili, a zatim
i (samo odobrene, naravno) realizova-
li. Dakle, zamislimo hipotetičku situa-
Internet ogledalo - specijalno izdanje - DATA
tom konkretnom kreditu. Naravno, da
bi „dešifrovano” znanje za nas ima-
lo neku korist u praksi, iskoristićemo
mogućnosti Watson Studija da napra-
vimo ML model treniran ovim znanjem
i iskoristićemo ga, putem REST API-ja,
za kreiranje sopstvene aplikacije za
evaluaciju online kreditnih prijava.
Dakle, da konkretizujemo naš za-
datak: počevši od slobodno dostupnih
podataka, korišćenjem Watson Studija
treba napraviti obrnuti inženjering
Pomenuti podaci (desetogodišnja
istorija kreditnih prijava u CSV forma-
tu) su ponuđeni za slobodno preuzi-
manje na URL-u samog provajdera i
lako je doći do njih prostom internet
pretragom. (Slika 1)
Pored samih podataka, provajder je
ponudio i „šifarnik” sa opisom svake
kolone iz glavnog CSV fajla, koji nam
omogućava da bolje razumemo šta
koji podatak znači.