Kuidas muuta andmete kasutamine riigis efektiivsemaks? Maksu-ja tolliamet jagab kogemust

Uudis
Postitatud 16. oktoober 2024, 8.00

Korrastatud andmevarad aitavad luua paremaid teenuseid maksumaksjatele ja hoida kokku riigi ühist raha. Nii kirjeldab maksu- ja tolliametis (MTA) andmevarade korrastamist juhtiv Alvar Pihlapuu andmehalduse kõige olulisemat eesmärki. Aga kuidas saada andmed korda? Statistikaamet ja MTA annavad nõu. 

Andmeid on palju ning neid tekib pidevalt juurde, ent nende kiire leidmise ja tõhusa kasutamise võtmeks on hästi korraldatud andmehaldus. Statistikaamet koordineerib andmehaldust Eestis ning juhendab ja nõustab avaliku sektori asutusi andmete korrastamisel. Selles blogisarjas jagame erinevate asutuste kogemusi ja väljakutseid oma andmehaldussüsteemi edendamisel – aga ka nende nõuandeid teistele organisatsioonidele. 

Kevadel kirjutasime transpordiameti kogemusest. Seekord vaatame, milline on andmete korrastamisel olnud maksu-ja tolliameti teekond. 

Koostöös statistikaametiga võttis MTA kaks aastat tagasi ette asutuse andmevarade korrastamise ja tegi algust andmehalduse ühe olulisima ja töömahukama osa – andmekirjeldusega. Ametil, mille peamised ülesanded on riigi maksutulude kogumine, ühiskonna kaitsmine varimajandusest tulenevate ohtude eest ning ausa kauba liikumise tagamine üle Euroopa Liidu välispiiri, seisis ees 100 mahuka andmeregistri kirjeldamine. Praeguseks on neist kirjeldatud üle 80 ja selle aasta lõpuks plaanitakse kirjeldamisega lõpule jõuda. „Me ütlesime juhtkonnale, et see on pingutust nõudev protsess, sest see töö tuleb inimeste põhitöö kõrvale. Aga me oleme lõpusirgel ja nüüd on andmevarade korrastamine saanud MTA üheks olulisimaks sisemiseks prioriteediks,“ kirjeldab MTA arendusosakonna juhataja Alvar Pihlapuu.

Kuidas andmevarade korrastamisega pihta hakata? 

Pihlapuu sõnul on vaikimisi valdav arusaam, et andmed ja nendega tegelemine on „IT-teema“, ja erihariduseta ei tasu andmevarade poole vaadata. Nii saigi Pihlapuu juhitava meeskonna esimeseks ülesandeks usalduse tekitamine riigipoolse „IT-maja“ ehk rahandusministeeriumi infotehnoloogiakeskuse (RmIT) ja MTA sisekontrolli ees. „Meie soov oli, et andmed liiguksid kogumahus meie endi kätte  –  et me näeksime, mis infosüsteemides peidus on. Et me saaksime hakata looma täiendavat väärtust sellest andmehulgast,“ kirjeldab Pihlapuu andmevarade korrastamise teekonna algust.  

Andmehalduskorra loomine oli üks esimesi samme, millega määrati rollide täpne jaotus andmekirjelduse loomiseks, haldamiseks ja kasutamiseks pikemas vaates. Täpsemate juhiste loomisega tekitas MTA Pihlapuu sõnul olukorra, kus organisatsioon usaldab teenusejuhte, kellest nüüd said ka andmeomanikud ehk andmete kogu elutsükli eest vastutajad. „Me usaldasime teenusejuhtidele kõik andmeväljad, mis meil olemas olid,“ sõnab Pihlapuu. Nüüd sai otseselt teenusejuhtide (nt füüsilise isiku teenusejuht, maamaksu teenusejuht jt) kohustuseks infosüsteemi andmeomanikena hoolitseda andmete kirjeldamise, kasutamise (ja ka kustutamise) eest ehk nende jälgida jäi kogu andmete elutsükkel. 

Andmekirjelduste olemasolu toetab juhtimisotsuseid 

Järgmise sammuna võttis Pihlapuu meeskond ette andmete kirjeldamise. Andmekirjelduste koostamisel pakkus MTA-le tuge ja nõu statistikaamet, kel on suur kogemus andmekirjelduste loomises. Statistikaameti andmehalduse tiimi juhi Annika Uibopuu sõnul võimaldab andmevarade korrastamine ja kirjeldamine tuvastada, millised andmed on organisatsioonil olemas, aitab paremini mõista nende tähendust ja konteksti ning seoseid teiste andmetega. „Hea andmekirjeldus hoiab kokku aega, mis kulub vajalike andmete leidmiseks ja taaskasutamiseks,“ kirjeldab Uibopuu

„Sa ei saa millegi eest otsustada ja midagi omada, kui sa ei tea, mis andmed sul täpselt on,“ räägib Pihlapuu, miks andmete kirjeldamine ette võeti. „Kuna kogu kirjeldustegevus tugines kokkulepitud korrale ning MTA sisekontroll veendus, et tegevus on süsteemne ja andmeomanikud võtavad vastutuse, on sisekontrollist saanud andmete kirjeldamise tugev toetaja.“

Selle aasta lõpuks jõutakse küll valmis 100 suure registri kirjeldamisega, kuid see on alles algus. Pihlapuu sõnul on  andmevarade korrastamine järjepidev tegevus. Järgmine samm on jõuda nii kaugele, et kõik kirjeldatud andmed saaksid otseliidestused andmebaasidega ning seejärel hakatakse määrama kvaliteedireegleid.

Aga milleks ikkagi andmete kirjeldamine?

 „Meie juhtkond ikka küsis algul, mis kasu me kõik sellest saame, et me nii suurt pingututust teeme andmete kirjeldamisega. Mis on andmekirjelduse väärtuspakkumine?“ kirjeldab Pihlapuu suurt küsimust, millele vastamine on aja jooksul üha lihtsamaks läinud. „Teenusejuhid saavad juba praegu anda täpsemaid vastuseid nende ees seisvatele äriküsimustele,“ kirjeldab ta, kuidas on andmevarade korrastamine end õigustanud.  „Andmekirjelduste olemasolu teeb andmed leitavaks ja mõistevaks ning toetab juhtimisotsuseid,“ rõhutab Pihlapuu. 

Kirjeldatud andmestik on tema sõnul vara nagu iga teine MTA põhivara. „Aga andmed üksi ei loo väärtust. See väärtus avaldub, kui me vaatame, kuidas aitavad korrastatud andmed meil äriküsimusi lahendada,“ selgitab ta. Ta toob näiteks äriküsimuse, kui suur on Eestis ümbrikupalga maksmise osakaal ja kui suur on sellest tulenev maksuauk. Ta kirjeldab, et just erinevaid andmeobjekte kogumis vaadates saame sellele küsimusele vastata. Lihtsustatult: vaadates näiteks  töötamise registris registreeritud töötajaid, tulu- ning sotsiaalmaksu laekumist ning  audiitorite poolt esitatud suhtarve ühtse andmeteenusena, saamegi maksuaugu välja arvutada. „On selge, et üksikud andmed sellist väärtust ei looks. Äriküsimusteks vormununa on kirjeldatud andmetel selge rahaline väärtus nii maksumaksjale kui ka MTA-le,“ võtab Pihlapuu kokku.  

Nüüd juba kaks aastat on andmehalduse korraldamine ja andmete kirjeldamine olnud MTA üheks strateegiliseks eesmärgiks ja prioriteediks. Pihlapuu sõnul juhib kirjeldamist usk ja arusaam, et korrastatud andmed teevad tulevikus infosüsteemide arendamise odavamaks, andmetes tekib rohkem läbipaistvust, andmed muutuvad lihtsamini leitavaks ja ka halduskoormus RmITile kui riigi „IT-majale“ väheneb. „Me näeme nüüd paremini ka neid infosüsteeme ja registreid, mida enam vaja ei ole. Me saame neid seeläbi järjepidevamalt sulgeda ja nii riigi raha kokku hoida.“ 

Andmete kirjeldamisel on selge rahaline mõõde riigieelarvele 

Ja jõuamegi tagasi andmete kirjeldamise kõige olulisema eesmärgini. Pihlapuu sõnul on Eesti nominaalne maksutulu kümne aastaga kahekordistunud. „Selle taga on nii kodanike ja ettevõtete kõrgem teadlikkus ja maksutahe kui ka MTA töö. Me loodame, et korrastatud andmevarad aitavad tulevikus luua maksumaksjale veel mugavamaid teenuseid,“ märgib ta. 

„Korrastatud ja kirjeldatud andmed on aluseks tehisintellekti rakendamisele: masinõppe sisendid peavad olema kvaliteetsed, vastasel juhul on väljund ettearvamatu,“ kirjeldab Pihlapuu edasisi plaane. 

Pettuste ja peidetud tegevuste varajaseks avastamiseks soovib amet olemasolevad ja pidevalt juurde tekkivad andmed siduda automaatselt loodavateks andmevõrgustikeks, mis kajastaksid tegelikke seoseid ettevõtluses ning võimaldaksid kiireid ja täpseid riskianalüüse ka võrgustike üleselt. „Võrgustikupõhises analüüsis kahaneb infotöötlusele kuluv aeg pea olematuks. Projekti tulemusena võiksid oluliselt väheneda otsekontaktid maksumaksjatega ja rahaline kokkuhoid oleks hinnanguliselt ligi 100 miljonit kahe aasta peale kokku,“ räägib Pihlapuu.

Mis kasu on korrastatud andmetest? 

  • Andmete korrastamisel on selge rahaline mõõde riigieelarvele. Kirjeldatud andmed on paremini leitavad ja mõistetavad ning on teadlike andmepõhiste otsuste aluseks. See aitab hoida kokku raha IT-arenduste ja inimeste töö arvelt. 
  • Suurim kasu andmekirjeldusest on andmekasutuse tõhusus ehk kokkuhoitud aeg, mis kuluks andmete leidmiseks ja taaskasutuseks.
  • Andmeobjekt üksi ei loo väärtust. Selle väärtus avaldub, kui me vaatame, kuidas aitavad korrastatud andmed meil lahendada äriküsimusi. 

  • Hästi hallatud andmevarad võimaldavad organisatsioonil pakkuda paremini suunatud avalikke teenuseid.

  • Andmekirjelduste olemasolu toetab juhtimisotsuseid. Andmeomanikud peavad olema organisatsiooni sees. Kui andmete üle otsustamine jääb andmebaase haldavatesse IT-majadesse, ei toimu tegelikult andmepõhist juhtimist.
  • Andmete kirjeldamine toetab tehisintellekti lahenduste väljatöötamist ja rakendamist. Masinõppe mudelite koolitamiseks on ülioluline, et kasutatavad andmed oleksid usaldusväärsed, täpsed ja selgesti mõistetavad. 

 

 

Loe andmehalduse korralduse kohta täpsemalt statistikaameti veebist.

 

Täpsem teave:

Heidi Kukk
meediasuhete juht
statistika levi osakond
statistikaamet
tel 625 9181
press [at] stat.ee (press[at]stat[dot]ee)

 

Foto: Shutterstock