Asutuste andmehalduse ülevaade

Eesti organisatsioonide andmete valdkonna hetkeolukorra kaardistus

Aprillis 2025 viisid justiits- ja digiministeerium ning statistikaamet läbi küsitluse, et hinnata Eesti avaliku sektori asutuste andmevõimekust. Küsitlus on osa iga-aastasest seirest, mille eesmärk on saada ülevaade riigi andmehalduse hetkeseisust ja arengusuundadest. 

Sellel lehel on esitatud kokkuvõtte küsitluse peamistest tulemustest ja olulisemad tähelepanekud avaliku sektori hetkeolukorrast andmete valdkonnas. 

Tulemused näitavad, et pooltes asutustes on andmete valdkond laiemalt ja kitsamalt andmehaldus strateegiline suund ning mitmel asutusel on selles valdkonnas kõrge võimekus. Ülejäänud asutused vajavad aga olulist tuge ja juhendamist. Andmehalduse küpsust võib hinnata heaks üksikutes asutustes. Samas ka kõige kõrgema võimekusega asutustes on mitmed alamvaldkonnad alles arengu algusjärgus.

Esmaseid järeldusi

  • Asutused keskenduvad eelkõige teemadele, mis on neile strateegiliselt olulised (s.t kajastuvad arengukavas). Andmehaldus on arengukavas pooltel vastanud asutustest. Enim on esil andmeanalüüs nii statistikaks kui juhtimiseks, andmekaitse ja andmehaldus (ülevaade ja andmekvaliteedi probleemid). Neile valdkondadele on rohkem määratud ka vastutajaid. Samas on asutuste strateegiates vähe riigi poolt edendatavaid teemasid, nagu nõusolekuteenus, andmejälgija kasutamine või andmemajandus. Tulemustest selgub, et andmemajandus ei ole sageli arusaadav valdkond ja sellega võib põhjendada vähest huvi.
  • Oodatult on analüütilistest andmestikest kõige paremini hallatud andmekogud ja infosüsteemid. Muud analüütilised andmestikud on nii vastutajate kui ka kirjelduste loomise osas ligikaudu 25% tasemel.
  • Asutused ootavad statistikaametilt kõige enam konsultatsioone ja praktilist abi. Sellest võib järeldada, et meie mitmeaastane koostöö asutustega spetsialistide tasemel andmekirjelduste koostamisel andmekogudele on olnud viljakas ning seda on vaja jätkata.
  • Andmekvaliteedi süsteemne käsitlus ja kvaliteedi tõstmine on jätkuvalt suurim väljakutse. Edendamist vajab tegelemine nii andmekvaliteedi haldust võimaldavate andmehalduse rakendustega kui ka kasutamise metoodikaga.
  • Andmeanalüütika on asutustes hästi rakendunud. Kasutusel on erinevad vahendid ja olemas on kompetents (83,7%). Tehtava analüütika sisust piisavalt süsteemset ülevaadet ei ole. Vastustest ilmnes, et enim kasutatakse analüütikat finants- ja personalijuhtimises.

Poliitikasoovitused

  • Selleks et tagada riigi andmehalduse ühtlaselt kõrge tase, on vaja pakkuda tuge ja ressursse nii andmehalduses edenenud kui ka alustavatele asutustele. Vajakajäämiste likvideerimiseta teadmistes-oskustes ja rakenduste juurutamise toeta ei ole planeeritud poliitikaid võimalik ellu viia. Statistikametilt ootavad asutused andmete valdkonna sisulise toetamise jätkamist.
  • Kui ei pööra pidevat tähelepanu üleriigiliste eesmärkide ja asutuse vajaduste koos käsitlemisele, ei suuda me strateegiliselt neid lähendada.
  • Riigi andmeküpsuse jätkuvaks kasvuks on ülioluline, et asutustes tegeldaks andmehaldusega veelgi enam strateegilisel tasemel. 2027-2028 perspektiivis peaksid andmehalduse tegevused olema kajastatud 80-90% asutuste strateegilistes dokumentides ja tegevuskavades.
  • Andmete hea kvaliteedi ja taaskasutatavuse tagamise eelduseks on asutuste andmevaradele ja andmehalduse tegevustele vastutajate määramine. On rõõm näha, et 2024. aasta andmete põhjal on mitmetes asutustes ja ministeeriumides sellised vastutused juba määratud. Riigiülese andmete heakorra tagamiseks on vaja, et lähiajal määratakse sellised vastutused läbivalt kõigis asutustes ja kõigi riigi andmevarade osas.

Küsitluse eesmärk, läbiviimine ja metoodika

Eesmärk ja läbiviimine

  • Lühiülevaade annab vastuse mõnele justiits- ja digiministeeriumi ning statistikaameti koostöös läbi viidud küsitluse küsimusele. Küsitlus viidi läbi aprillis 2025 ja küsiti olukorda 2024. a lõpu seisuga. Vastajaid oli 138. Küsitlus saadeti kõigile riigi- ja valitsusasutustele, osadele nende hallatavatele asutustele ning kohalikele omavalitsustele (linna- või vallavalitsused).
  • Küsitlus viiakse läbi iga-aastaselt.
  • Küsitluse eesmärk:
    • "Andmete ja tehisaru kasutamine efektiivsuse tõstmiseks, andmepõhisele juhtimisele üleminek ja riigi andmete turvaline kasutusse andmine Eesti majanduse hoogustamiseks on hetkel ühed olulisemad eesmärgid meie riigi arengus. Nimetatud teemad on üheks peamiseks fookuseks digiühiskonna arengukavas (DÜAK 2030), samuti on andmepõhisus olulisel kohal enamuse teiste valdkondade strateegiates ja arengukavades."
    • Nende eesmärkide saavutamisel on oluline iga üksiku Eesti organisatsiooni andmevõimekus – suutlikkus andmeid süsteemselt ja turvaliselt koguda, hallata, avalikustada, taaskasutada, tehisaru lahendusi rakendada ja nendega seotud riske hinnata. Omakorda on andmete ja tehisaru teemade kesksete vastutajate ja toetajate (sh Justiits- ja Digiministeerium, Statistikaamet, Riigi Infosüsteemi Amet, Andmekaitse Inspektsioon, Eesti Keele Instituut) jaoks oluline omada ülevaadet organisatsioonide võimekusest, edusammudest ja puudustest.
    • Sellise tervikülevaate abil saame mõistlikult kujundada riigi keskseid tegevusi ning suunata ressursse just nendele tegevustele, kus neid kõige rohkem vaja on.

Metoodika

  • Küsitlus saadeti statistikaametist asutustele LimeSurvey kaudu.
  • Analüüs tehti Excelis (kirjeldav statistika) ning R-is (Posit), milles arvutati korrelatsioonimaatriks, ja peakomponentide analüüsi (PCA) abil leiti K-keskmiste klastrid. Kirjeldava statistika analüüs ja klastrid, mida on 2, näitasid samu tulemusi.
  • Avaliku sektori asutused rühmitasime järgmiselt:
    • (1) ministeerimid = 10 (lisasime Riigikantselei, üks ministeerium ei vastanud)
    • (2) „ametid“ = 49 (ametid, inspektsioonid, IT-majad ja muud valitsusasutused)
    • (3) KOV-id = 67
    • (4) muud = 12
  • Klastrid on:
    • "Kavakindel ja vastutajatega andmehaldus";
    • "Toetust vajav alustav andmehaldus".

Küsitluse sisuline ulatus kattis järgmised teemad:

  • Andmehalduse korraldamine. (Strateegiline juhtimine ja vastutus)
  • Töös olevad valdkonnad ja suurimad vajadused
  • Andmestike kaardistus ja kirjelduste koostamine
  • Kasutatavad rakendused ja juhiste kasutamine. Sõnastike koostamine
  • Andmete/andmestike avalikustamine ja avaandmete temaatika
  • Andmekvaliteediga tegelemine
  • Andmestike elukäigu teema (säilitamine, hävitamine; andmelaod)
  • Andmete analüüs ehk andmeanalüütika tegemine ja vahendid
  • Tehisintellekti teemaga tegelemine
  • Nõusolekuteenuse ja andmejälgija rakendamine

Kasutusel on 3 loendit, mis annavad valikvastused mitmele küsimusele, ja need on (loendiväärtused on esitatud allpool):

  • andmetega seotud teemad asutuses;
  • andmete valdkonna alamvaldkonnad;
  • andmestike tüübid. 

Statistikaameti analüüs hõlmab rühmi „ministeeriumid“ ja „ametid“.

Andmehalduse korraldamine (strateegiline juhtimine ja vastutus)

(1) Mida uurime?

  • Andmete valdkonna esitatus asutuse arengukavas ⁠(eeldasime, et kui teema on arengukavas, siis ka tähelepanu all) ning millised andmehalduse teemad on kavaga kaetud.
  • Vastutajate olemasolu.
  • Suurim andmehalduse alane vajadus.

(2) Vastuste analüüs

  • Andmete valdkond on ligi pooltes ministeeriumide ja ametite arengukavades. (MIN - n=10 on 5-l ehk 50% ja AMET - n=45 on 25-l ehk 56%). Mõningate eranditega saab öelda, et asutustes, kel on andmehaldus arengukavas, on see üldse paremas olukorras ehk klastris esitatuna oleksid nad rühmas "kavakindel ja vastutajatega andmehaldus".
  • Kogu meie etteantud teemade nimekiri rühmitus kavas olemise (st olulisuse) järgi kolme gruppi:
    • üle 3/4 andmeanalüüs, ülevaade andmestikest, andmekvaliteet, andmekaitse;
    • 2/3 kuni pooled ⁠– andmekirjeldus, andmete väärtus, ava- ja põhiandmed, andmearhitektuur, tehisintellekt;
    • alla 1/3 ⁠– keeletehnoloogia, andmejälgija, nõusolekuteenus ja andmemajandus.
  • Nagu jooniselt näha, domineerivad andmeanalüüsiga seotud tegevused. Väga olulisel kohal on veel osa andmehalduse teemasid ja andmekaitse. Mõnevõrra väiksem on strateegiline huvi just nende teemade vastu, mis on üleriigilises koordineerimises esil, nagu AI, põhiandmed, andmete kasutamine teenuste korraldamise edendamisel. Sootuks vähem on aga strateegilises fookuses andmejälgija, nõusolekuteenus ja andmemajandus.
  • Ainult 3 asutust nimetasid, et neil ei ole vaja täiendavat võimekust (sh 1 ministeerium). Üheksast erinevast võimekusest hindas 54 asutusest kõige suuremaks puuduseks keerulisemat tehnoloogilist ja sisulist kompetentsi vajavad lõigud: andmearhitektuur, andmekvaliteedi tagamine, andmeteadus ja tehisintellekti kasutuselevõtt.
  • Kuna üle 80% ametitest ja ministeeriumidest vastas, et nende asutuses tegeletakse andmekaitsega, ei ole üllatav, et kõige vähem lisavõimekust vajavaks valdkonnaks hinnati „andmekaitse korraldamine (isikuandmete kaitse, andmeturve)“ (14,8%). Teine valdkond, milles asutused hindavad oma võimekuse pigem piisavaks, on „avaandmed, andmete avalikustamine“. Selle tähendus vajab lisaanalüüsi. Küll aga leidis taas kinnitust see, et juhtkond on andmevaldkonna edendamisel pigem teadlik ja võimekas.

(3) Küsimused

  • Kas asutuse arengukavas on andmete valdkonda käsitletud eraldi teemana?
    • Millised järgmised teemad on arengukava või muu teie asutuse kavaga kaetud?
    • Kui kaua kehtib praegune asutuse arengukava?
  • Millistele andmete valdkonna tegevustele on määratud vastutajad või vastutused?
  • Nimetage eelmises küsimuses loetletud valdkond, millel ei ole veel vastutajat, aga näete selle järele kõige suuremat vajadust.

Kasutatud vastusevariantide loendid  ja muutujad, millega need on seotud

Andmetega seotud teemad asutuses:

  • Andmekorraldus, sh andmehalduse eest vastutajate määramine
  • Andmetest, andmevaradest, andmestikest või muust andmetega seotud üksustest ülevaate omamine (kaardistus, inventuur)
  • Andmete väärtuse väljaselgitamine ja haldus; andmete elukäigu haldus
  • Andmearhitektuuri ning andmete töövoogudes ja teenustes kasutamise ülevaade ning selle juhtimine
  • Põhiandmete kindlaksmääramine ja haldus; ühtsete klassifikaatorite kasutamine
  • Andmekirjelduste koostamine, andmekataloogi pidamine
  • Andmete ja andmekirjelduste avalikustamine; avaandmete haldamine
  • Andmekvaliteedi tuvastamine ja parendamine
  • Andmeanalüüs andmepõhiseks juhtimiseks
  • Andmeanalüüs aruandluseks ja statistikaks
  • Tehisintellekti arendamine
  • Tehisintellekti kasutuselevõtt (sh generatiivne tehisintellekt)
  • Keeletehnoloogia rakendamine
  • Andmekaitse korraldamine (isikuandmete kaitse, andmeturve)
  • Nõusolekuteenus
  • Andmejälgija kasutamine
  • Andmemajandus

Andmete valdkonna alamvaldkonnad:

  • Andmete valdkonna võimekus juhtkonnas
  • Andmehalduse korraldus
  • Andmearhitektuur
  • Andmekirjeldused (metaandmed)
  • Avaandmed, andmete avalikustamine
  • Andmekvaliteedi tagamine
  • Andmeanalüüs
  • Andmeteadus ja tehisintellekti kasutuselevõtt
  • Andmekaitse korraldamine (isikuandmete kaitse, andmeturve)

Andmestike tüübid:

  • andmekogud
  • infosüsteemide andmestikud
  • tellitud uuringute või analüüside andmestikud
  • analüütika ja statistika andmestikud

Töös olevad valdkonnad ja suurimad vajadused

(1) Mida uurime?

  • Mida ja kellega koos tehakse?
  • Millest on enam puudust?
  • Milliste andmehalduse alamvaldkondadega tegeletakse (vt nimekirja ülal)?

(2) Vastuste analüüs

  • Asutused tõid koostöö tegemisel välja väliseid partnereid üksikutel juhtudel. Ka siis oli tegu pigem IT-ettevõttega, kellega oli laiem koostöö kui andmehalduse/tehisintellekti valdkonnas. Ministeeriumid nimetasid oma valitsemisala IT-maju. Küsitlus ei andnud selget pilti, milliste väliste partneritega asutused koostööd teevad.
  • Ainult 3 asutust ütlesid, et nad ei vaja täiendavat võimekust (MIN=1, AMET=2).
  • Kõige rohkem tunti kompetentsist puudust järgmistes valdkondades: (1) andmeteadus ja tehisintellekti kasutuselevõtt (50,0%), (2) andmekvaliteedi tagamine ja (3) andmearhitektuur (46,3%).
  • Kõige vähem tunti võimekuse puudust avaandmete ja andmete avalikustamise valdkonnas (9,3%). Samas on see hinnang vastuolus sellega, kuivõrd asutused tegelikult oma andmestikke avaandmetena kuvavad. Põhjust vastuse ja tegelikkuse erinevuse vahel on vaja eraldi uurida.
  • Pakkusime välja 18 teemat ehk andmehalduse alamvaldkonda. Vastused saab rühmitada kolmeks:
    • (1) ÜLE 2/3 | Nagu võiski eeldada, tegeletakse kõige enam järgmiste teemadega: (1) andmekaitse, kusjuures on üldse selgusetu, miks see ei ole 100%; (2) ülevaade andmestikest ja (3) andmeanalüütika;
    • (2) 2/3 kuni 1/3 | 2/3 peal on teemad, mis on ka olnud üleriigiliselt prioriteetsed, 1/2 peal on väärtuse, kvaliteedi ja mõned muud teemad;
    • (3) ALLA 1/3 | Üllataval kombel on asutustes vähese tähelepanu all mitmed riigile prioriteetsed teemad, nagu nõusolekuteenus, andmejälgija, keeletehnoloogia ja eriti andmemajandus. Andmemajanduse puhul võib oletada, et asutused ei tea, millega on tegemist, ja ei oska seetõttu hinnata, kas nad sellega tegelevad. Keeletehnoloogia osa võib asutustes katta (generatiivse) tehisintellekti kasutuselevõtt, mille märkis ära 61,4% vastajatest.
  • Jaotus nii mitmeks teemaks võib tekitada raskusi vastamisel, sest on kattuvusi. Meie eesmärk on muuta saadud vastuste alusel jaotust üldisemaks.

(3) Küsimused

  • Nimetage olulisemad välised partnerid andmete valdkonnas (näiteks haldusala IT-maja) ning kirjeldage nende rolli ja panust.
  • Millisest andmete valdkonna võimekusest on teie asutuses kõige suurem puudus?
  • Millistega järgmistest teemadest teie asutuses praegu tegeletakse?

Andmestike kaardistus ja kirjelduste koostamine

(1) Mida uurime?

  • Ülevaade andmestikest. Ülevaate koostamist nimetame kaardistamiseks ning seda on uuritud nelja andmestikutüübi kaupa: andmekogud; infosüsteemide andmestikud; tellitud uuringute või analüüside andmestikud; analüütika ja statistika andmestikud.
  • Kas andmestikele on määratud omanikud/vastutajad?
  • Andmekirjelduste koostamise seis.

(2) Vastuste analüüs

  • Asutuste küsitlemine meie esitatud neljases andmestike tüüpide jaotuses oli esmakordne! Saadud vastused kinnitasid tunnetuslikku pilti, mille oleme saanud asutustega koostööd tehes. Tegelemine andmekogudega andmehalduse vaates on kordades muust üle. Meie kaks rühma – andmekogud ja infosüsteemide andmestikud – võisid paljudel juhtudel ka asutuste jaoks olla samad, sest kõigil asutustel ei ole andmekogusid.
  • Uuringute ja analüütika/statistika andmestike kaardistamine vajavad edaspidi suuremat tähelepanu. Hetkel tuleb nentida, et me ei näe numbrite taha ja oleme sunnitud käsitlema vastuseid formaalsetena.
  • Analoogne on üldpilt ka vastutajate olemasoluga: ainult 4 asutuses puudus vastutaja. 1/3 asutustes on vastutaja kogu uuringuid/analüütikat/statistikat puudutaval osal,  1/3 osas vastutajat pole ja 1/3 osas on vastutajad määratud osaliselt.
  • Kirjelduste loomine on asutustes umbes sama heal tasemel kui andmekogude kaardistus. Andmekogude ja infosüsteemide andmete kirjeldused on kordades paremas seisus kui uuringute ja analüütika/statistika osa. Mõnes asutuses on kirjeldatud lausa 100% andmetest.

(3) Küsimused

  • Millises ulatuses on asutus kaardistanud oma andmestikud?
  • Millises ulatuses on andmestikele määratud vastutajad?
  • Kui paljudele andmestikele on loodud kirjeldused?

Kasutatavad rakendused ja juhiste kasutamine. Sõnastike koostamine

(1) Mida uurime?

  • Millised on andmekirjelduste koostamisel kasutatavad rakendustarkvarad.
  • Statistikaameti jt koostatud juhiste kasutamine.
  • Andme- ja ärisõnastike koostamine.

(2) Vastuste analüüs

  • Üheks enam huvi pakkuvaks küsimuseks osutus andmehalduse rakendustarkvarade kasutamine. Vastajad said valida etteantud variantide seast või lisada ise sobiva info. Tuleb märkida, et kolmel korral mainitud Enterprise Architect ei ole tegelikult mõeldud andmekirjelduste koostamiseks, ja on kahtlus, et selle tarkvara kasutajad samastavad andmemudeli dokumenteerimise andmekirjelduse koostamisega.
  • Juhiste ja standardite kasutamise osas saab üldistavalt öelda, et 2/3 kasutab neid keskmiselt või suures ulatuses ja 1/3 kas minimaalselt või üldse mitte. Vähese või mittekasutamise põhjused on vaja välja selgitada edaspidi.
  • Teiseks nii asutustele kui ka statistikaametile suurt huvi pakkunud küsimuseks oli: "Millist tuge vajate Eesti andmekirjelduse standardi järgi andmete kirjeldamisel?" Ilmnes, et üle 2/3 ootab ja vajab aktiivset abi konsultatsioonide ja ka kirjeldamise juhendamise näol ning 1/2 vajab koolitusi ja juhiseid. Ühest küljest näitab see statistikaameti senise lähenemise õigsust ja tulemuslikkust, kuid samas on see ressursimahukas lähenemine.
  • Andme- ja ärisõnastike koostamine asutustes kinnitas statistikaameti teadmist selle hetkeseisust: asutustes töö nendega käib. Arvud on praeguseks sedavõrd muutunud, et nende välja toomisest siin 2024 lõpu seisuga loobusime.

(3) Küsimused

  • Valige, milliseid rakendusi andmekirjelduse koostamisel või haldamisel kasutate!
  • Mil määral kasutate Eesti andmekirjelduse juhiseid?
  • Mil määral olete andmekirjelduste koostamisel rakendanud andmekirjelduse standardit?
  • Millist tuge vajate Eesti andmekirjelduse standardi järgi andmete kirjeldamisel?
  • Loetlege andmekogud, millele olete koostanud andme- või ärisõnastiku.

Andmete/andmestike avalikustamine ja avaandmete temaatika

(1) Mida uurime?

  • Andmestike avalikustamine ja olukord avaandmetega.

(2) Vastuste analüüs

  • Ligi 1/2 asutustest vastas, et nad avaldavad andmestikke asutuse veebilehel (n=24), lisaks 6 asutust veel asutuse andmeportaalis ja 5 asutust valdkondlikus andmeportaalis. Selline vastamine oli ootuspärane, kuid sisuliselt väljakutsuv, sest küsimise eesmärk oligi aru saada, milline on just väljaspool avaandmete portaali avaldamise seis.
  • Protsess avaandmete tuvastamiseks ja avalikustamiseks oli olemas 2/3-l asutustest.
  • Andmestike avaldamiseks Eesti avaandmete teabeväravas pakkusime välja kolm vastusevarianti:
    • 1/3 eelistas: "Andmestike kirjelduste käsitsi haldamine teabeväravas, andmete viitamine asutuse veebilehelt või muust asukohast";
    • 2/3 eelistas: "Automaatne andmestike ja/või andmekirjelduste peegeldamine teabeväravasse";
    • üksikud eelistasid: "Andmestike ja nende kirjelduste käsitsi haldamine teabeväravas".

(3) Küsimused

  • Asutuste andmestike kirjeldused avaldatakse RIHA-s. Kus teie asutus veel oma andmestikke või nende kirjeldusi avaldab?
  • Kas Teie asutuses on olemas protsess avaandmete tuvastamiseks ja avalikustamiseks?
  • Selgitage, millist lahendust andmestike avaldamiseks Eesti avaandmete teabeväravas peate sobivamaks.

Andmekvaliteediga tegelemine

(1) Mida uurime?

  • Andmekvaliteedi teemaga tegelemine asutustes, kasutatavad rakendustarkvarad, seiremeetodid ja andmekvaliteeti mõjutavad tegurid.

(2) Vastuste analüüs

  • Andmekvaliteedi teema osas esitasime mitu vastamisel läbimõtlemist eeldavat küsimust. See oli teadlik metoodiline valik, et paremini mõista olukorda asutustes.
  • Andmekvaliteedi süsteemi rakendamist uurisime andmestike tüüpide kaupa (andmekogud, infosüsteemide andmestikud, tellitud uuringute või analüüside andmestikud, analüütika ja statistika andmestikud). Oleme vastuste tõlgendamisel ettevaatlikud, sest nii andmekvaliteedi kontseptsioon kui ka andmestike tüübid võivad olla erinevalt mõistetavad. Seepärast esitame tulemused naturaalarvudes asutuste hulgana. Andmekogude ja infosüsteemide haldamine on teiste andmestikega võrreldes asutustes oluliselt rohkem levinud.
  • Andmekvaliteeti negatiivselt mõjutavaid põhjuseid saime aga analüüsida avatud vastustest põhjalikumalt. Saime põhjused siduda kvaliteedikriteeriumitega ja üldistada asutuste selgitused. Järgnevalt esitatud kriteeriumid ei ole tähtsuse järjekorras ega kvantitatiivselt esitatud.
Ebakorrapärane või puudulik andmesisestusAndmeid sisestatakse käsitsi või puuduvad ühtsed reeglid andmete kontrollimiseks. Põhjustab andmetes vigu, andmestikus puudulik info, andmekirjeldused on ebaühtlased.
Halvasti integreeritud infosüsteemidKui erinevad süsteemid ei suhtle omavahel tõhusalt või kasutatakse mitut andmeallikat ilma ühtse standardita, võivad tekkida vastuolulised või dubleerivad andmed.
Vanad mittekvaliteetsed andmedAndmeid ei uuendata või ei kontrollita regulaarselt. Andmed on vananenud, ebatäpsed ning kasutud.
Automaatsete andmeedastuste vead või tehnilised tõrkedIntegratsioonide või sünkroniseerimiste käigus võivad andmed valesti üle kanduda või tekkida duplikaadid.
Vähene töötajate koolitus ja teadlikkusKui töötajad ei ole piisavalt teadlikud andmete olulisusest või neil ei ole vajalikke oskusi, suureneb vigade ja ebaühtluse risk.
Puudulikud andmehalduse protsessid ja vastutusaladKui ei ole selgelt määratletud, kes vastutab andmete kvaliteedi, haldamise ja korrashoiu eest, jäävad vead sageli tähelepanuta või parandamata.
Standardite ja andmevormingute veadKui puuduvad ühtsed nõuded (sh standardid) andmetele, muutub andmete töötlemine ja analüüsimine keeruliseks ning tulemused ebausaldusväärseks.
  • Küsisime samuti, milliseid andmekvaliteedi seire meetodeid olete rakendanud. Seda küsisime kolmes osas:
    • Millist kvaliteediraamistiku osa kasutate?
    • Kuidas kasutate andmekvaliteedi mõõtmisel kvaliteediraamistikku?
    • Kuidas kasutate andmekvaliteedi probleemide lahendamisel kvaliteediraamistikku?
  • Vastuseid sellele, kuidas asutused kvaliteediraamistikku kasutavad, oli sedavõrd vähe, et saame neist välja tuua ainult kaks, mille puhul oli rohkem vastanuid: (1) andmekvaliteedi probleemide lahendamine (n=9), mis on väga üldine vastus, ja (2) protsessides andmekvaliteedi vigade leidmiseks ja ennetamiseks (n=8).
  • Meil on oluline teada, millist andmekvaliteedi rakendust asutused kasutavad. Saime oodatud vastused, et kasutus on vähene ja mitmekesine. Toodi välja, et andmekirjeldusteks kasutatavad rakendused Accurity ja SelectZero on kasutusel ka andmekvaliteedi haldamisel.
  • Põhjustena, miks asutused ei ole midagi kasutusele võtnud, toodi välja: (1) vahendite puudus (n=11), teadmiste puudus (n=14) ja sobiva puudus (n=4).
  • 2/3 MIN ja AMET grupi asutustest kasutavad mingeid kvaliteedijuhiseid või meie kvaliteediraamistikku, 1/3 ei kasuta. 

(3) Küsimused

  • Millises ulatuses olete rakendanud andmekvaliteedi süsteemset haldamist?
  • Loetlege kuni kolm peamist põhjust, mis mõjutavad negatiivselt andmekvaliteeti teie asutuses.
  • Valige, milliseid andmekvaliteedi seire meetodeid olete rakendanud.
  • Kas kasutate mõnda tarkvara või rakendust andmekvaliteedi haldamisel?

Andmestike elukäigu teema (säilitamine, hävitamine; andmelaod)

(1) Mida uurime?

  • Mõningad seosed andme- ja infohalduse vahel ⁠– andmestike kajastamine liigitusskeemis.
  • Andmestike säilitamise ja hävitamise mõningad aspektid.
  • Andmelao olemasolu.

(2) Vastuste analüüs

  • Küsisime seoste kohta info- ja andmehalduse vahel. Täpsemalt, kas asutus haldab kuidagi andmestikke liigitusskeemi abil. Jaatavalt vastas MIN 5 ja AMET 30. Esialgu me ei tea, millistes sarjades ehk mis andmestikud need 35 asutuse puhul on, ega ka seda, mis põhjusel ei halda ülejäänud 1/3 asutusi andmestikke sarjades. Siin võib eeldada ka valdkondadevahelist mõistelist segadust. Igal juhul ei ole meil selget ülevaadet, mida asutused peavad andmestikeks ja avaandmeteks ning kuidas nad neid haldavad. 22 asutust (MIN=4, AMET=18) ütlesid, et neil on eraldi hoiukoht, kus säilitatakse andmestikke pärast nende igapäevase kasutusvajaduse möödumist.
  • Küsimusele "Kas asutus kustutab/hävitab eraldi isikuandmeid andmestikest või andmekogudest pärast nende säilitustähtaja möödumist?" vastasid jaatavalt 35 asutust (MIN=7, AMET=28). Meil puudub täpsem teave, mis ulatuses ja kuidas nad seda teevad või on see ainult fikseeritud kohustusena ning kas hävitatakse ainult isikuandmed dokumendis/kirjes või kogu objekt.
  • Eraldi pöörasime tähelepanu teemale, kas asutusel on andmeladu. Me ei täpsustanud kuidagi, mis on ühe või teise asutuse jaoks andmeladu, vaid tahtsime saada üldist arusaama. 
    • AMET rühm vastas, et neil on 25 andmeladu, MIN rühmas on andmeladusid 4. Mida need 29 andmeladu sisuliselt kujutavad, on tarvis edasi uurida, nagu ka nende kasutust andmeanalüüsi tegemisel või muuks.

(3) Küsimused

  • Kas asutuse liigitusskeem või arhiiviskeem sisaldab sarju, milles on andmestikke?
  • Kas asutus kustutab/hävitab eraldi isikuandmeid andmestikest või andmekogudest pärast nende säilitustähtaja möödumist?
  • Kas asutusel on eraldi hoiukoht, kus säilitatakse andmestikke, millel ei ole igapäevast kasutusvajadust?
  • Kas asutuses on kasutusel andmeladu?

Andmete analüüs ehk andmeanalüütika tegemine ja vahendid

(1) Mida uurime?

  • Milliseid analüüsitarkvarasid kasutatakse?
  • Milline on võimekus?
  • Mida soovitakse lisaks analüüsida esijoones juhtimisotsuste tegemiseks?

(2) Vastuste analüüs

  • MIN ja AMET rühma asutused kasutavad analüütiliseks tööks mitmeid tarkvarasid, kuid mõõtuandvad on PowerBi ja Tableau. Asutused said valida mitu ning ei ole teada, millist nad enam kasutavad, ega seda, mis eesmärgil konkreetselt. PowerBI on kasutusel 7 MIN rühma asutuses  ja 23 AMET rühma omas, Tableau 5 MIN ja 20 AMET asutuses. SAS on kasutusel ainult AMET grupi asutustes. Excel on kasutusel kõikjal ning selle märkimist või märkimata jätmist on raske tõlgendada. Ainult Exceli kasutamist nimetasid 2 asutust.
  • 81,8% asutustest nimetasid, et neil on töötajaid, kes toetavad kolleege andmeanalüütika alastes küsimustes ja vajadustes. See oli ka üks meeldivamalt üllatavaid tulemusi, mis näitab, et 4/5 asutustest on endal rahuldav andmeanalüüsi tugi.
  • Oluliselt vähem (58,2%) märgiti andmeanalüütika süsteemse protsessi olemasolu. Sealjuures vastas sellele küsimusele jaatavalt 4 MIN asutust, mis näitab, et poliitikaplaneerimise ja aruandluse süstemaatilisel korraldamisel on arenguruumi.
  • Vastused küsimusele, milliseid andmeid sooviksite oma asutuse juhtimisotsuste toetamiseks kasutada, kuid praegu puudub selleks võimekus, on väga mitmepalgelised. Vastused ei allu hästi üldistamisele, mistõttu toome ära mõned iseloomulikud tendentsid.
    • Vastanutest 1/4 kirjutasid, et neil on võimekus olemas, ning ainult 3 ütlesid, et nad ei tea veel täpsemalt, milliseid andmeid tahaksid kasutada.
    • Üllatav oli, et kaks asutust nimetasid, et sooviksid rohkem analüüsida dokumendihaldustarkvara (Delta) andmeid.
    • Ei olnud üllatav, et viis asutust tahaksid rohkem kasutada SAPi (st finantsjuhtimise või personalitöö andmeid).
    • Kümme asutust nimetasid, et tahaksid rohkem kasutada oma põhitegevuse andmeid või statistikat. See oli ka kõige suurem rühm ning nende hulgas oli ka viis ministeeriumit, kellest kahe puhul oli selgelt tuletatav, et nad tahaksid andmeid kasutada ka poliitika planeerimiseks. (Neil mõlemal on suur ja teenusterohke valitsemisala.)
    • Üllatavalt vähe toodi välja soovi kasutada uuringuid.
    • Samuti ei sidunud pea ükski vastaja andmete vajadust tugevama kontrolliga.
    • Võimekuse puudujääkidena toodi ainult paaril juhul välja personalipuudus, mis oli taas üllatav, kuid see on koos tõlgendatav takistustega. Takistustena nimetati andmekvaliteeti ja üldse juurdepääsu puudumist vajalikele andmetele.
    • Kokkuvõttes võib öelda, et asutuse juhtimisotsuste toetamiseks vajavad asutused kõige enam üldisemaid finants- ja personaliandmeid ning teiseks oma põhitegevuse või valitsemisala tegevuste andmeid.

(3) Küsimused

  • Nimetage asutuses kasutatavad BI- ja andmeanalüüsi tarkvarad (nt SAS, PowerBI, Tableau).
  • Kas asutuses on töötajaid, kes toetavad kolleege andmeanalüütika alastes küsimustes ja vajadustes?
  • Kas teie asutuses on loodud süsteemne protsess andmeanalüütikaks, et vastata klientide andmekasutusvajadustele?
  • Milliseid andmeid sooviksite oma asutuse juhtimisotsuste toetamiseks kasutada, kuid praegu puudub selleks võimekus?

Tehisintellekti teemaga tegelemine ja üldhinnangud

(1) Mida uurime?

  • Justiits- ja digiministeeriumi vajadus seirata poliitikaeesmärkide täitmise seisu tehisintellektiga tegelemise osas.

(2) Vastuste analüüs

  • Selle ploki vastuseid analüüsib põhjalikumalt justiits- ja digiministeerium.
  • Tulemid on toodud küsimuste kaupa allpool!

(3) Küsimused

  • Kas olete oma asutuses rakendanud tehisintellekti lahendusi või testinud neid katseprojektides?
    • "Jah, on teinud" vastas 89,1%, sh ainult 1 MIN ei ole.
  • Kas teie asutuses on viimase 12 kuu jooksul kaardistatud valdkondi, kus võiks rakendada tehisintellekti arendusi?
    • "Jah" vastas 83,3%, sh kaardistuse tegemist on vähem kui katsetamist, mis näitab, et asutused on AI-ga pigem töösse läinud.
  • Kas plaanite lähiajal (järgmise aasta jooksul) viia läbi tehisintellekti rakendamisega seotud projekte?
    • "Jah" vastas 83,6%.
  • Kas plaanite lähiajal (kuni 1 a jooksul) võtta kasutusele Bürokrati?
    • "Jah" vastas 11,4% (MIN=1, AMET=4). See arv näitab, et üleriigiline võimalus ei ühildu asutuste kavatsustega.
  • Milline on teie üldine hinnang asutuse andmete ja tehisintellekti valdkonnale?
    • MIN grupi hinnag kõigub "väga heast" "tagasihoidlikuni". Välja toodi nii kiiret muutust, millega kas jõuab või ei jõua kaasas käia. Enam kui pooltel on plaanid olemas.
    • AMET grupis ilmneb detailidesse minemata sama pilt, mis üldiselt: on mõned, kes näevad olukorda väga heana (2-3), suur hulk toob välja erinevaid tegevusi ja nendega seotud väljakutseid. Ühtegi negatiivset hinnangut toimuvale või valdkonnale üldiselt ei antud. 
  • Mis on peamised edasiviivad tegurid andmete ja tehisintellekti valdkonnas?
    • MIN grupis oli sisulisi küsimusi vähem välja toodud ja rohkem oli esile tõstetud töötajate teadmiste ja oskuste vajalikkust ning tööriistade vajalikkust. 1 MIN grupi asutus panustaks rohkem oma IT-majale.
    • AMET grupis saab sisuliste osade kõrval välja tuua juhtkonna toetuse olulisust edasiviiva faktorina.
  • Mis on peamised takistavad tegurid andmete ja tehisintellekti valdkonnas?
    • MIN grupis 2 rõhutasid õigusaktide selguse vajadust, 1 keskse koordineerimise puudust, 1 segadusi andmetega ning 5 töötajate teadmiste ja oskuste vähesust.
    • AMET grupis toodi välja samad teemad, millele lisandus rahalise ressursi puuduse esiletoomine.
  • Nimetage asutuse järgmise kahe aasta kolm kõige prioriteetsemat tegevust andmete ja tehisintellekti valdkonnas.
    • MIN grupi osas võib öelda, et tehisintellekti seadis prioriteetseks 1 ning erinevad andmehalduse tegevused 8 (üks ei vastanud).
    • AMET grupis oli 2 asutust, kes prioritiseerisid tehisintellekti, ülejäänud aga mingeid andmehalduse tegevusi. Mõnevõrra üllatav oli, et analüütiliste tegevuste osakaal prioriteetide seas oli väga väike; see on seletatav selle suuna tugeva olemasoluga.

Halduskoormus, nõusolekuteenuse ja andmejälgija rakendamine

(1) Mida uurime?

  • Justiits- ja digiministeeriumi vajadus seirata poliitikaeesmärkide täitmise seisu:
    • halduskoormuse jälgimine ja ühekordse küsimise printsiip;
    • nõusolekuteenuse ja andmejälgija kasutamine.

(2) Vastuste analüüs

  • Selle ploki vastuseid analüüsib põhjalikumalt justiits- ja digiministeerium.
  • Halduskoormuse seiret teeb 1/3 asutustest (koos KOV n=30), MIN ja AMET rühmas 1/2.
  • Andmete korduva küsimise vältimise kohta tõi üle 60 asutuse (sh KOVid) välja mingi tegevuse.
  • Nõusolekuteenust plaanisid aasta jooksul (2025) kasutusele võtta 5 asutust/andmekogu.
  • Andmejälgija plaanivad 2025 kasutusele võtta 13 MIN ja AMET rühma asutust ning veel 2 MUUd asutust ja 5 KOV-i.
  • Logide kasutamise osas ⁠– küsisime kasutamise hinnangulist suhtarvu ⁠– ei näidanud vastused analüütiliselt kuigi palju. 100% logivad 40% asutustest, ülejäänud teevad seda osaliselt. Põhjus ja täpsem rakendamine andmekogu puhul on teadmata.

(3) Küsimused

  • Kas seirate kodanike ja ettevõtjate halduskoormust andmete esitamisel?
  • Milliseid meetmeid on asutus rakendanud, et vältida andmete korduvat küsimist kodanikelt ja ettevõtjatelt?
  • Millises ulatuses on asutuse andmekogudes rakendatud logisid?
  • Kas plaanite lähiajal (kuni 1 a jooksul) teha analüüsi andmejälgija rakendamiseks asutuse andmekogudes?
  • Millistes andmekogudes plaanite lähiajal (kuni 1 a jooksul) võtta kasutusele nõusolekuteenuse?