Autor: Maarja Olesk

Kui Brett Goldstein 2011. aastal Chicago linna andmepealikuna tööle asus, oli linn avaandmete vallas juba esimesed sammud teinud. Olemas oli avaandmete portaal mõne andmehulgaga, kogukonnas leidus ka andmete kasutamise huvilisi, ent areng seisis justkui paigal. Kõik muutus, kui selsamal 2011. aastal astus ametisse uus linnapea, kelle jaoks oli andmepõhine otsustamine ja linna andmevara jagamine kogukonnaga selge prioriteet. Vaid mõni aasta hiljem oli Chicago avaandmete programmist saanud kohaliku omavalitsuse avaandmete musternäidis, mille edulugu on äratanud üleilmset huvi.

Ehkki Eestis Chicago mõõtu omavalitsusi ei ole – ammugi mitte ressursside mõttes –, saab nende kogemusest siiski üht-teist kasulikku kõrva taha panna. Goldstein räägib oma kogemust kokku võtvas loos, millised sammud aitasid linna avaandmetel uutesse kõrgustesse tõusta. Esiteks tagas juhtkonna huvi avaandmete vastu piisava ressursi, sh andmejuhi värbamise, kellele avaandmetega tegelemine ülesandeks tehti. Teiseks otsustas linn pingutada, et teha paar kasutajate poolt enim nõutud andmestikku kiiresti kvaliteetsete masintöödeldavate avaandmetena kättesaadavaks. Küllap ei ole eriline üllatus, et Chicagos oli nõutuimate andmete seas kuritegevuse statistika. Kuritegevuse andmete avaldamine mugavalt kasutatavate ning iga 24 tunni tagant automaatselt uueneva andmehulgana oli linna jaoks paras peavalu, ent tasus end kuhjaga ära, sest tõi kaasa suure avaliku tähelepanu ja pani kasutajad innukalt andmetega tööle. Sellest hakkas lumepall juba täiskiirusel edasi veerema.

Chicago endine andmejuht rõhutab, et linn on saanud avaandmete avaldamisest selget kasu. Esiteks aitavad kohalikud avaandmed inimestel oma praktilist igapäevaelu paremini plaanida. Näiteks võimaldab tänavate koristusgraafiku avaldamine autoomanikel jälgida, millal tuleb auto eest ära parkida, ja välja kirjutamata jääb nii mõnigi trahvikviitung. Teiseks saavad linna avaandmeid oma uurimistöös kasutada teadlased ja tudengid, ilma et ametnikud peaksid nendega pikka kirjavahetust pidama ja teabenõuetele vastama. Kolmandaks hoiavad avaandmed pikas plaanis omavalitsuse ressursse kokku, kuivõrd kogukonna jaoks väärtuslike andmete avamine võimaldab andmehuvilistel ja ettevõtetel luua „iseteeninduse“ korras täpselt niisuguseid teenuseid ja rakendusi, nagu kohalikele vaja, ilma et omavalitsus peaks ise äpimajandusse sukelduma.

Ameerikast Eestisse tulles näeme, et avaandmete riiklikus teabeväravas on enam kui 100 andmeavaldaja seas kõigest viis kohalikku omavalitsust. Lisaks Tallinnale ja Tartule, kes on avaldanud kümneid andmehulki, leiab portaalist veel vaid kolm tagasihoidlikku viidet kolme omavalitsuse avalikule dokumendiregistrile. Tegelikult on kohalike elanike (ja mitte ainult kohalike!) jaoks huvipakkuvaid andmeid kahtlemata igal omavalitsusel. Kogukonna jaoks kõige kasulikumad andmed on enamasti üsna argised ja seotud inimeste igapäevaste toimetustega: ühistranspordigraafikud, bussipeatuste ja rattaparklate asukohad, info liikluse ja teede seisukorra kohta, avalikud üritused, aga ka heakorrainfo, nagu tänavaaugud, torutööd, teele kukkunud puud jm jooksvalt tekkivad andmed, mille kogumisse saab „anna teada“-tüüpi rakenduste kaudu edukalt kaasata ka kohalikku kogukonda. Näiteks Tallinna linna avaandmed teevad võimalikuks selle, et iga linnas liikuja saab ühistranspordi liikumist reaalajas jälgida ja selle põhjal oma logistikat planeerida. Tartu rattaringluse parklate asukohainfo jällegi aitab nii kohalikel kui ka külalistel eelistada linnas liikudes tervislikke ja keskkonnasõbralikke liikumislahendusi.

Teine oluline kategooria on igat sorti ruumiandmed, mis aitavad inimesi muuhulgas elukoha valikul: koolide, lasteaedade, mänguväljakute, poodide ja polikliinikute asukohad, liikumisraskustega inimeste jaoks aga ka näiteks kaldteedega varustatud poodide ja asutuste asukohad. Turistidele jällegi pakuvad huvi söögikohtade, hotellide, turismiinfo, vaatamisväärsuste ja meelelahutusasutuste asukohad, mida kasutavad sisendina mitte ainult omavalitsuse enda loodud, vaid ka globaalsete tehnoloogiahiidude kaardirakendused – näiteks Google Maps.

Kolmas grupp väärtuslikke andmeid on kõik see, mis heidab valgust omavalitsuse enda tegevusele ja rahakasutusele. Nende hulka kuuluvad valla- ja linnavolikogude, -valitsuste ja komisjonide istungite protokollid ja otsused. Ühelt poolt aitavad need elanikel omavalitsuse tegevusega kursis olla, aga teisalt on sedasorti tekstikorpustest ootamatult palju kasu ka keeletehnoloogia arendamisel – mida rohkem seda tüüpi dokumente masintõlkesüsteemid treeningandmetena näevad, seda kvaliteetsemat tõlget saavad nad tulevikus pakkuda ka omavalitsusele endale. Samasse kategooriasse kuuluvad muidugi ka avalike teenuste kvaliteeti puudutavad andmed, mida riik on juba asunud keskselt koguma ja jagama minuomavalitsus.fin.ee veebikeskkonnas.

Selle andmegrupi raames on eriti oluline kategooria info kohaliku omavalitsuse eelarve ja selle kasutamise kohta. Kui eelarveandmed on masinmõistetavas vormingus avalikuks tehtud, saab kes tahes luua võrdlemisi lihtsa vaevaga veebirakenduse, mille kaudu elanikud saavad omavalitsuse olulisematel kulu-ja tulukategooriatel silma peal hoida – vaata näiteks Viimsi valla eelarverakendust. Lisaks numbrilisele infole tasub avalikustada ka see, mida nende numbrite eest saadud on. Nii tuletati jaanuaris toimunud kohalike omavalitsuste andmehalduse töötoas kohalikele omavalitsustele meelde avaliku teabe seadusest tulenevat kohustust avalikustada omavalitsuse eelarvest rahastatud uuringud ja analüüsid. Sedasorti teabe kasutajaskond on sageli oluliselt laiem kui vaid kohalik elanikkond.

Avaandmeid ei tasuks siiski näha üksnes heatahtliku žestina avalikkuse suunal. Kvaliteetsed andmed pakuvad otsuste tegemisel tuge ka omavalitsuse ametnikele endile – masinmõistetavas vormingus andmetele saab ehitada reaalajas uuenevaid juhtlaudu ja veebirakendusi (nagu näiteks portaal Tark Tartu), mida on ametnikulgi mõnusam jälgida kui kuivadesse Exceli tabelitesse kaevuda. Muide, suurepärase näite avaandmete kasulikkusest omavalitsuse töös leiab ka Chicago linnast. Seal aitasid avaandmed luua mudeli toitlustusasutuste inspektsioonide optimeerimiseks, mis aitas tuvastada toiduohutusnõuete rikkumisi varasemast keskmiselt 7,4 päeva varem. Mudeli testimisel selgus, et rikkumiste tõenäosust aitab ennustada üheksa peamist andmestikku, mis olid kõik linna andmeportaalis avaandmetena kättesaadavad – nende seas näiteks info toitlustusasutuste varasemate rikkumiste kohta, toitlustusasutuse tüüp, kolme viimase päeva keskmine kõrgeim temperatuur, lähiümbrusest laekunud kaebused jäätmete ja sanitaartingimuste kohta, tubaka- ja alkoholimüügi litsentsi olemasolu või ka viimasest inspektsioonist möödunud aeg. Nende andmete põhjal oli võimalik hinnata toiduohutusnõuete rikkumise tõenäosust ning reastada lihtsas Shiny rakenduses omavalitsuse ametnikele kõik toitlustusasutused rikkumisriski järjekorras, et siis selle põhjal inspektsioone täpsemalt sihtida. Kui mudeli lähtekood tehti GitHubis avalikuks, suudeti mudeli täpsust vabatahtlike kaastööliste abil veelgi parandada.

Ent millest siis ikkagi alustada, kui teie vald või linn on otsustanud avaandmete maailmas kätt proovida?

  1. Nagu asjatundjad jaanuarikuises töötoas rõhutasid, tuleb enamikul omavalitsustel esmalt luua ülevaade andmetest, mis asutuses üldse olemas on. Seega tasub esimese sammuna ette võtta üldine andmerevisjon, et tuvastada, milliseid andmeid millistesse andmebaasidesse kogutakse, kui ajakohased need on ning ega töötajate vahetumisega ole olulisi andmeid kogemata kellegi arvutisse seisma jäänud. Selline audit loob aluse avaandmete avaldamiseks, aga võimaldab ka tuvastada erilist kaitset vajavad andmekomplektid, mida mingil juhul avaldama ei peaks.
  2. Teiseks, nagu Chicago näide õpetas, tasub pingutada selle nimel, et avaldada mõni kasutajate jaoks eriti väärtuslik andmestik masinmõistetavas ja mugavalt kasutatavas formaadis. Lisaks ülalloetletud olulisematele andmekategooriatele tasub andmete valikul lähtuda sellest, milliseid andmeid teabenõuetega sageli küsitakse. Nii on võimalik ühe hoobiga vähendada ka korduvaid teabepäringuid ja hoida kokku ametnike tööaega.
  3. Kui esimesed andmekomplektid on avaldatud, tuleks need teha kasutajatele kergesti leitavaks, lisades viite andmetele riiklikku teabeväravasse. Avaldamise järel ei tasu aga käed rüpes istuma jääda – lihtne viis andmete vastu huvi äratada on korraldada väike virtuaalne häkaton, mis kutsuks huvilisi andmete põhjal kasulikke rakendusi looma. Lisaks mõningasele tööajale kulub sellise ürituse korraldamiseks ehk vaid sümboolne auhinnaraha, aga kasu on sellest suur, näidates avalikkusele, mida andmetega teha saab, ja näidates omavalitsusele, kes nende andmete kasutajad on.

Avaandmete poliitika koordinaatorina on Majandus- ja Kommunikatsiooniministeerium valmis omavalitsustele avaandmete asjus nõu ja tuge pakkuma ning alustab peagi ka pilootprojektiga, et toetada andmete avaldamist valitud omavalitsustes. Seni võtab omavalitsuste küsimused, mured ja ettepanekud heameelega vastu MKMi andmenõunik Sigrit Siht (sigrit.siht@mkm.ee).


Artikkel ilmus algselt Eesti avaandmete portaalis. Avaandmete portaali sisustatakse Euroopa Liidu struktuuritoetuse toetusskeemist „Infoühiskonna teadlikkuse tõstmine“, mida rahastab Euroopa Regionaalarengu Fond. Projekti tegevused viib läbi MTÜ Open Knowledge Estonia.