Autor: Dr. Andres Kõnno, Tallinna Ülikooli teadur ja BFMi nüüdismeedia magistriõppe kuraator

Kultuuriandmetest ja digikultuurist rääkides oli aasta 2020 eriline mitmel põhjusel. Laiemale avalikkusele meenuvad tõenäoliselt ennekõike COVID-19 pandeemia tõttu kodudiivanilt külastatud virtuaalnäitused või -teatrietendused. Kitsamas, poliitikakujundamise vaates oli aga tegemist digikultuuri teema-aastaga, mille eesmärk oli tutvustada digitehnoloogiate kasutamisega kaasnevaid kultuurivorme. Teema-aasta tulemusel valmib jaanuaris 2021 Eesti digikultuuri raport, mis käsitleb ka avaandmeid. Vaatame osalt sellele raportile tuginedes Eesti digikultuuri olukorda ja avame, miks on vaja kultuuriandmete valdkonnas paradigmamuutust.

Sõna digikultuur ise ütleb meile, et tegemist on kultuuri defineerimisega teatud funktsiooni kaudu. Digikultuur ei tähenda asjaolu, et kultuuri tarbimine toimub mingi digiplatvormi vahendusel, näiteks et kuulame Facebookist Arvo Pärti. Digikultuur tähendab ennekõike, et kanali valikuga kaasnevad uued sotsiaalsed tegevused. See ei tähenda mitte ainult tarbimist (kellele ei meeldiks teleka ees võileibu süüa), vaid ka erinevaid uusi kultuurivorme, mis koos uute tehnoloogiatega võimalikuks muutuvad.

Strateegilises plaanis ei ole vaja digikultuuri arendamiseks rääkida mitte digikultuurist, vaid seda toetavatest meetmetest.

Eesti digikultuuri vaates on digikultuuri raportis ilmselt olulisimaks tõdemus, et Eestis ei ole üldist arusaama, mida nn digikultuur endast kujutab. Ennekõike saab välja tuua kaks teineteist täiendavat vaadet: a) akadeemiline ja uurimuslikus kontekstis viljeldav pigem selgepiiriline nägemus sellest, mis on digikultuur ja b) riigi strateegiadokumentides pigem lõdvalt, aga see-eest pikema arenguperspektiivi määratlemiseks kasutatav mõisteraamistik. Strateegilises plaanis ei ole vaja digikultuuri arendamiseks rääkida mitte digikultuurist, vaid seda toetavatest meetmetest. Näiteks keeletehnoloogiast, erinevate arhiivide andmebaaside semantikate ühilduvusest, haridusinnovatsioonist, digipädevuste arendamisest, autoriõigustest, digimaksust, e-publikatsioonide käibemaksu vähendamisest 9%-le jne. Kultuuriministeeriumi, aga ka Haridus- ja Teadusministeeriumi ning Majandus- ja Kommunikatsiooniministeeriumi toel on viimase 15 aastaga tehtud ära suur praktiline töö nn digikultuuri ehk digitaalseks muudetud kultuuri erinevate tahkude populariseerimiseks.

Digiteerimise asemel suund lõppkasutajale

Selle valdkonna esimesed strateegiadokumendid pärinevad nullindate keskpaigast. Tagantjärele hinnates seadsid need kavad eesmärgiks täita väga suured eesmärgid pigem väikese ajaraami sees. Juba 2009. aastal avaldatud Riigikontrolli analüüsis „Kultuuripärandi digiteerimine, digitaalse kättesaadavuse ja säilimise tagamine“ tõdetakse, et arengukava „Digitaalne kultuuripärand 2007-2010“ eesmärkide täitmine selliselt, et mäluasutustele ja nende poolt loodava info tarbijatele sellest olulist kasu oleks, pole reaalne. Veel 2013. aasta arengukava eesmärgiks oli viia digitaalsele kujule valdav osa Eesti kultuuripärandist ja teha see kõigile ühiskonnaliikmetele kättesaadavaks. Praegune digiteerimise tegevuskava sai valmis 2018. aastal ja see kestab kuni aasta 2023 esimese poolaastani [1]. Selle eesmärgiks on teha 2023. aastaks digitaalselt kättesaadavaks kolmandik meie mäluasutustes talletatavast kultuuripärandist ja uuendada mäluasutuste info hoidmise taristut.

Digiteerimise tegevuskava koordineeriv digitaalse kultuuripärandi nõukogu hakkab peatselt arutama järgmise, alates 2023. aastast kehtiva tegevuskava loomist. Järgmises tegevuskavas kavatsetakse keskenduda mitte niivõrd eri pärandiliikide digimisele, vaid pigem läheneda andmetele lõppkasutaja vaatevinklist. Esmajärjekorras tuleks vastata küsimustele, nagu milliseid uusi tegevusi ja teenuseid on vaja, milliseid tehnoloogiaid tuleks selleks arendada jne.

Orienteerumine kultuuriandmete kasutajakesksele talletamisele tähendab sisulist paradigmamuutust ka avaandmete perspektiivist vaadates.

Orienteerumine kultuuriandmete kasutajakesksele talletamisele tähendab sisulist paradigmamuutust senistes ennekõike digiteerimisele orienteeritud tegevustes. See tähendab paradigmamuutust ka avaandmete perspektiivist vaadates. Vaadates tänast avaandmete portaali võib avaldatud kultuuriandmestike nimekiri tunduda muljetavaldav. Nende andmete kvaliteet on aga ebaühtlane ja kasutamine pole paljudele jõukohane. Erinevad kultuuriinstitutsioonid küll toodavad avaandmeid, kuid mingit reaalset väljundit sellel tegevusel üldjuhul ei ole. Heaks näiteks on riigi digiteenuste konkurss „Su)g“ [2] , mille 75st osalejast esindas kultuurivaldkonda vaid Tallinna Kunstihoone poolt loodud virtuaalekspositsiooni rakendus [3]. Seega saab avaandmete perspektiivist vaadates tänase seisuga rääkida „digikultuurist“ kui nn kultuurilisest praktikast, mis käib kaasas üldise tehnoloogilise arenguga.

Tulevikku vaadates on avaandmete perspektiiv digikultuuri vaates palju huvitavam kui olevikulises perspektiivis. 2020. aasta sügistalvel arutatakse selle üle, milliseid andmeid peaks Eesti tulevikus esitama planeeritavasse EL-i koordineeritud üle-Euroopalisse väärtuslike avaandmete kogumisse (nn PSI-direktiiv, ehk public sector information directive) [4]. Eesti soovib lisada olemasolevasse nimekirja keeleressursside valdkonna. Perspektiivis tähendab see, et tõsisemalt hakatakse suhtuma kõikidesse keeletehnoloogiate objektiks olevatesse andmetesse, mida Eesti mäluasutused on seni üsna erimoelistes formaatides tõstnud avaandmete portaali teistele kasutamiseks. Teisisõnu: kõikide Eesti mäluasutuste arhiivid muutuvad masinloetavaks, ristkasutatavaks ja erinevate masinõppe algoritmide abil analüüsitavaks.

Mida see sisuliselt tähendab, me tegelikult ei tea. Nii nagu me veel ei tea, kas ja millisel kujul võib oodata paljuräägitud „asjade interneti“ andmete muutumist avaandmeteks ja milline võiks olla selle potentsiaalne majanduslik tulu. Sest 5G tehnoloogia, mis on kõnealuste teenuste vahendamiseks suuteline, ei ole asi iseeneses. Selle kasutuselevõtmisest räägitakse küll palju (tõsi, tihti kahjuks pigem biopsühholoogilises võtmes), aga millised on need rakendused, mida kasutada, me samuti veel ei tea.

Kõik andmed on kultuuriandmed

Eesti on jõudnud küll kaugele, kuid reaalselt on neid andmeid, mida kultuuriandmetena analüüsida, ikka veel väga vähe.

Siinkohal võiks kultuuriandmete kui avaandmete teemale joone alla tõmmata, sest Eesti on jõudnud küll kaugele, kuid reaalselt on neid andmeid, mida kultuuriandmetena analüüsida, ikka veel väga vähe. Nagu öeldakse, kus faktidest enam ei jätku, sealt algab ilukirjandus. Siinkohal on paslik juhtida Eesti auditooriumi tähelepanu ühele suurepärasele düstoopiale, mille sündmustik sobilikult hargnebki just kultuuri- ja sotsiaalandmete tõlgendamisest sündivates algoritmilistes intriigides.

Viktor Pelevini „iPhuck 10“ ilmus esmakordselt 2017, tõlkena eesti keeles 2020 kevadel. Pelevini raamat maalib meile pildi tulevikust umbes 22. sajandi alguses. Sisekaitsejõududele kuuluva Porfiri Petrovitši funktsiooniks on olla uurija-kirjandusrobot. Tema tööks on koguda andmeid ja rääkida nendest lugusid. Piltlikult öeldes – Porfiri Petrovitšit on õpetatud nägema puude taga metsa. Nägema andmete ja andmehulkade vahel põhjuslikke seoseid, nendega spekuleerima ja koostama nendest lähtudes erinevaid narratiive. Seda tehes surfab Porfiri Petrovitš mööda erinevaid võrgustunud seadmeid, analüüsib nendesse talletunud andmeid, nende logifaile ja kaardistab selliselt sekund sekundi kaupa ühiskondlikku ajalugu. Ta teab kõike või kui ei tea, on vajalik informatsioon võimalik kas leida või tuletada.

Selle düstoopia igapäevaelu rütmid on määratud algoritmiliste lahenduste kaudu. Need toodavad meeletutes kogustes andmeid. Inimesed ei mäletagi enam aega, mil ühiskonnas toimuvat oli võimalik mõista ja tõlgendada ilma kasulike robotiteta, kes oskavad „näha“ olulisi muutusi ja neile vajalikul hetkel tähelepanu juhtida. See andmestunud ühiskonna düstoopia on piisavalt detailne tõdemaks, et ilmselt juba palju varem kui saja aasta jooksul on selline lahendus vähemalt tehnoloogilises plaanis realistlik.

Pelevini düstoopias on meie jaoks olulised neli aspekti. Esiteks: juhul kui „mõtlevad“ loojutustamisrobotid on ka tulevikus väga kallid, on tõhusa algoritmi omamine privileeg, mis pakub selle omanikule suuremaid sotsiaalseid eeliseid kui mistahes täna kujuteldav võrgupõhine teenus.

Teiseks: tulevastes andmestunud ja andmetöötlusel põhinevates ühiskondades on potentsiaal uuteks ebavõrdsuse liikideks, mida me täna veel kujutledagi ei oska. Ennekõike ebavõrdsuseks just selles mõttes, et kui nn sotsiaalse data tekitamises osalevad kõik ühiskonnaliikmed, siis päriselt saavad neist kasu ainult need, kes on selleks kas piisavalt rikkad või piisavalt pädevad.

Andmed teeb kultuuriliseks nende tõlgendamine osana kultuurkontekstist. Sisuliselt tähendab see, et selle sõna kõige laiemas tähenduses on kõik andmed kultuuriandmed.

Kolmas aspekt on ausalt öeldes ka põhjus, miks tsiteerida Pelevinit, rääkides Eesti kultuuriandmetest ja nende tõlgendamisest anno 2020: mistahes andmed võivad olla kultuuriandmed, juhul kui nende andmete tõlgendaja omistab neile kultuurilise narratiivi. Teisisõnu, andmed teeb kultuuriliseks nende tõlgendamine osana kultuurikontekstist. Sisuliselt tähendab see, et selle sõna kõige laiemas tähenduses on kõik andmed kultuuriandmed. Näiteks Tallinna Ülikooli juures alates 2020. kevadest tegutsev kultuuriandmete analüüsi keskus (CUDAN ehk Cultural Data Analysis) määratleb kultuuriandmeid õige laialt, kammitsemata end ühe või teise definitsiooniga, mis ühtlasi seaks piirid uurijate valikuvabadusele. Põhimõtteliselt võib kultuuriküsimustega laetuks moondada ükskõik millise sotsiaalsest kontekstis pärineva andmestiku.

Ja neljandaks: Pelevini kirjandusroboti näitel on küsimus ennekõike selles, mis nendest andmetest hiljem edasi saab? Kui palju kultuuriandmetest on avalikus kasutuses, kui palju nendest kuulub erasektorile, mida nendega tehakse ja millistele regulatsioonidele need protsessid alluvad? Näiteks: kas on olemas mingit liiki andmeid, mille ristkasutamine ei ole lubatav?

Siinkohal tuleme tagasi Eestisse, 2020. aasta lõppu. Pelevini Porfiri Petrovitš tarbib suuresti just sellist tüüpi kultuuriandmete tarbija, nagu meie avaandmete riiklik strateegia ette näeb: andmed, mis on kõigile saadaval, läbipaistvad ja täiendatud detailsete metaandmetega (muidugi on PP-l ka palju teisi omadusi, mida tänane seadusandlus tegelikult ei reguleerigi). Väärib tähepanu, et tulevaste kultuuriandmete lõpptarbimist ei reguleeri ka tänane Eesti seadusandlus. Ja miks peakski? Sest mingit meie jaoks kujuteldamatult teistsugust tarbimist ju täna ei ole.

Kindel on see, et andmestunud ühiskonnas disainitavaid teenuseid ja nendest väljakasvavat sotsiaalset reaalsust piiritleb vaid meie enda mõtlemine.

Novembris 2018. aasta esines president Kersti Kaljulaid Tallinnas peetud e-riigi konverentsil UX Tulevikku. Presidendi ettekanne keskendus ennekõike inimeste ja robotite kooseksisteerimisega seotud dilemmadele. Täiesti ülekohtuselt korjas ajakirjandus presidendi ettekandest välja mõttekäigu, et /…/ …on viimane aeg hakata rääkima sellest, millised saavad olema tulevikus inimeste suhted, sealjuures seksuaalsed suhted robotitega – mis on keelatud ja mis mitte. [5] Antud juhul polegi tähtis, kas president sai inspiratsiooni Pelevinilt, kelle raamat ilmus aasta varem, või on see lihtsalt ajastu märk. Kindel on see, et andmestunud ühiskonnas disainitavaid teenuseid ja nendest väljakasvavat sotsiaalset reaalsust piiritleb vaid meie enda mõtlemine. Näiteks veel mõned aastad tagasi tundusid teleseriaali Black Mirror tüüpi tehnoloogilised düstoopiad lihtsalt põneva intellektuaalse meelelahutusena. 40+ põlvkonnale on George Orwelli „1984“ olnud alati midagi palju rohkemat kui lihtsalt halva unenäona heiastuv hoiatusromaan. Veel 70ndate keskel sündinud teavad hästi, mis on totalitaarne ühiskond. Aga seegi põlvkond ei osanud veel umbes 10 aastat tagasi arvata, et sotsiaalne profileerimine, nagu seda täna Hiinas, Venemaal ja mujal päriselt tehakse, on võimalik. Rääkimata siis nendest klienditeeninduste kõnerobotitest, kes innovaatilisemates asutustes juba hea mitu aastat meie igapäevamuresid lahendavad. Ka nemad töötlevad kultuuriandmeid.

Aga niikaua kui teenused kirjandusele järele ei jõua, tasub lugedes meeles pidada, et düstoopial kui žanril on vähemalt kolm kultuurilist funktsiooni: 1) hoiatamine kui teatav ühiskonnakriitika modus operandi: visioon teemal mis oleks kui…, 2) meelelahutuslikkus, kuivõrd see on ainus viis sellelaadse sõnumi viimiseks laiema auditooriumini, 3) düstoopia kui žanr, mis peegeldab meie tänast arusaama sellest, mis on üldse võimalik.**Ühe või teise stsenaariumi kujutamine realistlikuna tähendab, et sellest on saanud aruteluobjekt.

Samal teemal loe ka: Andres Kõnno: Kultuuriandmete rakendamine muutub järjest suuremaks väljakutseks

[1] Vt erinevaid tegevuskavasid ja nõukogu koosseisu Kultuuriministeeriumi kodulehelt: https://www.kul.ee/et/kultuuriparandi-digiteerimine-0
[2] Riigi digiteenuste konkursi “Su(g” parima digiteenuse kategooriasse laekus kokku 75 teenust, vt lähemalt: https://medium.com/digiriik/selgusid-riigi-digiteenuste-konkursi-su-g-finalistid-e2a47472f1d2
[3] https://www.kunstihoone.ee/
[4] https://ec.europa.eu/digital-single-market/en/public-sector-information-psi-directive-open-data-directive
[5] PM 08.11 2018 Aivar Pau, „Kaljulaid: on aeg rääkida seksist robotitega“, https://tehnika.postimees.ee/6448926/kaljulaid-aeg-on-raakida-seksist-robotiga-video


Artikkel ilmus algselt Eesti avaandmete portaalis. Avaandmete portaali sisustatakse Euroopa Liidu struktuuritoetuse toetusskeemist „Infoühiskonna teadlikkuse tõstmine“, mida rahastab Euroopa Regionaalarengu Fond. Projekti tegevused viib läbi MTÜ Open Knowledge Estonia.