Kaido Paabusk: Eesti vajab eraandmeid
Andmete taaskasutus era- ja avaliku sektori vahel ei toimi Eestis piisavalt hästi. Seda pärsib turvaliste lahenduste puudumine andmete jagamiseks ja tühimik ühiskondlikus debatis, et leida lahendusi. Me vajame arutelu selle üle, milliseid kompromisse on ettevõtted ja inimesed valmis enda andmete jagamisel tegema.
Artikkel on esmalt ilmunud ERR-i arvamusportaalis i 5. veebruaril 2025.
Eelmise aasta lõpus tuli IT-ettevõtja Taavi Kotka Õhtulehe usutluses välja mõttega, et ettevõtete halduskoormuse vähendamiseks aruannete esitamisel võiks Eesti riik kasutada palju ulatuslikumalt kommertspankadel olevaid andmeid. Tema hinnangul pole tegu kaugeltki uue mõttega – maksu- ja tolliamet kasutab juba aastaid seda tüüpi andmeid ning maksumaksjad on andmete automaatse liikumisega sedavõrd harjunud, et ei pane seda enam tähelegi.
Midagi uut pole selles üleskutses ka statistikaameti jaoks – sageli ja õigustatult küsivad ettevõtjad, miks me ikka veel saadame neile koormavaid küsimustikke ja miks me ei võta ettevõtete majandustegevust puudutavaid andmeid ettevõtete pangakontodelt. On ju pankadel need andmed kõik olemas. Tehnoloogilises ja metodoloogilises võtmes oleks vastus ettevõtjatele lihtne – statistikaamet võtaks sellised andmed avasüli vastu ja nii vähendaksime väga suurel määral andmete kogumisel ettevõtjatele tekkivat halduskoormust. Küll aga pole siin küsimus üksnes tehnoloogias või statistikaameti vananenud metoodikates.
Kuivõrd oleme valmis eraandmeid jagama, et ülejäänud ühiskonda vähem koormata?
Probleemi tuum peitub seadusandluses ja selle lahendamine vajab ühiskonna panust ja nõusolekut. Praegu kehtiv seadusandlus peegeldab Eesti inimeste valmisolekut riigiga andmete jagamiseks ja see peegeldus ütleb, et valmisolek ei ole kuigi suur. Ehkki riikliku statistika seadus annab statistikaametile üsna laiad volitused erinevat tüüpi andmete kasutamiseks ning paneb ettevõtetele isegi kohustuse vajalikud andmed ametile esitada, on olukord märksa mitmetahulisem. Näiteks “trumpavad” mitmed majandusvaldkonda reguleerivad eriseadused statistikaseaduse lihtsalt üle. See tähendab muu hulgas, et näiteks elektroonilise side seadus piirab statistikaametil kasutamast sideandmeid ja krediidiasutuste seadus keelab ligipääsu pangaandmetele.
Statistikaamet tegi paar aastat tagasi ettepaneku krediidiasutuste seaduse muutmiseks nii, et amet saaks ligipääsu pangasaladusega kaetud andmetele. Me soovisime neile andmetele pääseda ligi selleks, et eeltäita leibkonna eelarve uuringuvormi pankadel oleva infoga. Meie soov oli, et inimesed ei peaks enda pangakaardiga tehtud ostude infot käsitsi sisestama, kuna see oleks vägagi aeganõudev ja tõenäoliselt ka ebatäpne. Leibkonna uuringu ebatäpsed tulemused võivad omakorda tähendada moonutusi tarbijahinna indeksi ja sisemajanduse koguprodukti arvutamises.
Meie taotlusele seisid aga vastu mitmed avaliku sektori asutused ning ka pangaliit. Peamine tõke oli pangasaladus, millele ligipääs ongi arusaadavatel põhjustel väga piiratud. Nägime, et vastuseis on põhimõtteline. Seetõttu oleme olnud ettevaatlikud ka neis valdkondades, kus andmetele ligipääsu piiravaid eriseadusi pole ning kus me justkui võiks eravalduses olevaid ehk eraandmeid ettevõtetelt statistikaseaduse aluse välja nõuda, otsustanud seda teed mitte minna. See on põhimõtteline usalduse küsimus. Kuivõrd on inimesed ja ettevõtted nõus andma ligipääsu eraandmetele, et ülejäänud ühiskonda ja ettevõtteid vähem koormata? See tuleb selgeks vaielda.
Statistikaamet inimeste eraandmeid välja ei anna
Erinevalt teistest riigiasutustest kehtib statistikaametile üheselt mõistetav andmete konfidentsiaalsuse nõue, mis lubab andmeid ametist välja anda ainult nii, et üksikisikud pole tuvastatavad. Nii on meil avaliku sektori asutuste seas väga eriline positsioon: me kasutame ise ligi 500 andmekogu andmeid, aga anname neid välja (sh teistele riigiasutustele) vaid agregeeritud kujul, kus pole võimalik viia kokku üksikisikut ja tema andmeid. Nii me teame näiteks oma andmebaase ja metoodikaid kasutades, et rahvastikuregistris märgitud elukohad ei vasta alati neile, kus inimesed tegelikult elavad. Aga me ei saa rahvastikuregistri pidajale öelda, kelle andmed täpselt valed on. Parimal juhul saame välja anda suhtarve, mis näitavad, millistes omavalitsustes ja millisel määral registri andmed meie omadega ei klapi. Ka meie väga rangetele konfidentsiaalsusnõuetele vaatamata on eraandmete valdajad väga ettevaatlikud oma andmete jagamisega. Ja me oleme pidanud selle ettevaatlikkusega seni leppima, ehkki sellel on olnud kõrge hind nii ühiskonnale kui ka statistika kvaliteedi tagamisele.
Peame otsima võimalusi inimeste andmeid turvaliselt kasutada
Aga me ei taha leppida liigse halduskoormuse tekitamisega Eesti ettevõtjatele, kelle andmete najal avaldame ühiskonna toimimiseks hädavajalikke näitajaid, seal hulgas juba mainitud sisemajanduse koguprodukti. Õnneks võib eraandmete puhul hakata olukorda muutma tehnoloogiline areng ja seda mitte ainult statistikaameti jaoks. Üha enam räägitakse privaatsust tagavatest tehnoloogiatest (inglise keeles privacy enhancing technologies ehk PET). Need võimaldavad tundlikke andmeid erinevate osapoolte vahel töödelda nii, et teine teise poole andmeid ei näe. Sarnasel kujul töötab meie e-valimiste süsteem, kus me teame küll erinevates lõigetes, milliste kandidaatide poolt hääletati, aga pole võimalik kokku viia, kes kelle poolt hääletas. PETi kasutades ei näe statistikud, kelle andmetega tegu on ja seda ei olegi vaja isikustatud kujul teada. Olgu öeldud, et ka praegu ei näe statistikaameti analüütikud, kelle andmeid nad analüüsivad – andmed jõuavad analüütikuni pseudonümiseeritud kujul. PETide abil saaks erinevate osapoolte andmeid jagada aga veelgi turvalisemalt.
Statistikaameti huvi on kasutada rohkem eraandmeid
Privaatsust tagava tehnoloogia katsetamiseks taotles statistikaamet hiljuti rahastust riigikantselei innovatsioonimeetmest ja taotlus sai otsustajate tugeva toetuse. Projekti raames hakkame katsetama, kuidas aitaksid eraandmed tagada paremat teehoidu ja täpsemat ning mugavamat ühistransporti. Otsime avaliku ja erasektori koostöös lahendusi, kuidas erinevat liiki andmeid kasutusele võtta, privaatsust sealjuures riivatama. Aga otsida tuleb veelgi enam, sest andmevahetuse juriidiliste takistustega puutuvad iga päev kokku ilmselt pea kõik avaliku sektori asutused ja kardetavasti ka paljud eraettevõtted.
Eesti avaandmete ehk kõigile tasuta kättesaadavate avalike andmete valdkonna majanduslikuks mõjuks on hinnatud ligikaudu 400 miljonit eurot aastas. Peagi valmiva digiühiskonna arengukava järgi oleks senisest parema andmete taaskasutamise kaudu võimalik selle valdkonna väärtust mitmekordistada. See on raha, mis on hinnanguliselt võimalik teenida andmete targa ja turvalise taaskasutamise kaudu. Maksumaksjad ja riik tervikuna kaotab sellest potentsiaalsest rahahulgast suure osa, kui andmejagamisega seotud probleemidele lahendust ei leita. See kaotus oleks meile liiga kallis.
Statistikaameti huvi on kasutada rohkem erasektori ja eraisikute andmeid, et pakkuda parimat võimalikku statistikat ja hoida sealjuures kokku Eesti ettevõtjate ja elanike aega ning raha. Me vajame tõhusamat andmemajandust, mis eeldab märksa tihedamat era- ja avaliku sektori andmete taaskasutamist. Seetõttu kutsun ühiskonda arutama, milliseid kompromisse oleme valmis enda andmete jagamisel tegema, et ühiskondlik kasu andmete taaskasutamisest oleks suurim. Me ei oska – ja ei saa – neile küsimustele üksi vastata. Taavi Kotka viskas õhku intrigeeriva mõtte, mille kaudu saaks seda keerulist teemat hakata lahti harutama. Kas on huvilisi?