Eksperimentaalstatistika otsib viise, kuidas andmed arengukavades tööle panna
Mis on eksperimentaalstatistika ja kellele on seda vaja, räägivad statistikaameti eksperimentaalstatistika juhtivanalüütik Kaja Sõstra ja statistikaameti asepeadirektor Andres Kukke.
Mida eksperimentaalstatistika endast kujutab?
Andres Kukke: Meie põhiülesanne on reageerida ühiskonnas toimuvale ja anda kiire hinnang, mida arvandmed ühe või teise nähtuse kohta näitavad.
Eksperimentaalstatistika tegevuse võib jagada neljaks. Esiteks paneme kokku andmeid ja analüüsime valdkondi. Teiseks töötame välja rakendusi. Kolmandaks koostame mõjuanalüüse, et vastata kiiresti riigiasutuste vajadustele, nagu näiteks oli riigikantseleile tehtud liikuvusanalüüs koroonast tingitud eriolukorra ajal. Neljandaks tegeleme uute tehniliste metoodikatega, nagu veebi kammimine, andmete skännimine, uute andmeallikate kasutamine. Praegu on meie fookus valitsusele operatiivsete andmete andmisel, uutel rakendustel ja ristanalüüsidel.
Eksperimentaalstatistika tiim on statistikaametis tegutsenud kaks aastat. Mis oli teie esimene töö?
Andres Kukke: Esimese töö tellis meilt riigikantselei ja selle ülesanne oli analüüsida, mille poolest erinevad pered, kuhu sünnivad lapsed neist peredest, kuhu ei sünni lapsed. Sellest tööst tuli välja päris huvitavaid tõdemusi. Näiteks, kuidas ühe pere lagunemise ja teise pere tekkimisega kaasneb tihtilugu lapse sünd või kui uus ilmakodanik hakkab sündima, tehakse asi ruttu ametlikuks ja abiellutakse.
Kui palju eksperimentaalstatistika ikkagi eksperimenteerib?
Andres Kukke: Minu silme läbi võiksime isegi rohkem eksperimenteerida. Hetkel teeme palju tellimustöid. Üks eksperimentaalstatistika suundi on luua uusi kliendikanaleid või integreeruda nendesse rakendustesse, kus inimesed on harjunud käima, kuna nad saavad sealt mugavalt ja kiirelt sobivat infot.
Kliendikanaleid looma hakates alustasime noorteseirega, mis lõpuks jõudis juhtimislaudadele. Seejärel valmis sotsiaalministeeriumiga koostöös töötururakendus, millest omakorda arenes välja palgarakendus. Oleme seni pigem eksperimenteerinud sellega, kuidas ja mis kanalites andmeid levitada, mitte niivõrd uute ja eksperimentaalsete andmetega.
Eksperimentaalstatistika tiim koosolekul: kontoris Andres Kukke ja Kaja Sõstra, ülejäänud tiimiliikmed Skype´s. Foto: Uku Nurges
Kaja Sõstra: Võtame kasutusele ka elektriandmeid, mida tavastatistika ei tee. Statistikaamet juhib Euroopa statistikasüsteemi võrgustiku ESSNet projekti Big Data elektriandmete alamprojekti. Selle üks ülesanne on välja selgitada asustamata ja hooajaliselt kasutatavad eluruumid.
Kas teil on eeskujusid teistes riikides?
Kaja Sõstra: Jälgime Hollandit, kus tehakse hästi palju eksperimentaalstatistikat. Meie palgarakendus sai algatatud Rootsi näitel.
Mis tööd on praegu eksperimentaalstatistika tiimis teoksil?
Kaja Sõstra: Käimas on päris mitu tööd, milles analüüsime inimeste liikumist, et selgitada välja töö- ja elukoha seoseid ning kuidas kohalike omavalitsuste vahel liigutakse. Lisaks uurime, mis ettevõtted võiksid potentsiaalselt tegeleda teadus- ja arendustegevusega. Pooleli on pensionite rakendus, mis annab ülevaate, kuivõrd erinevad keskmised pensionid soo, vanuse, maakonna ja pensioniliikide kaupa.
Üks suurem käimasolev töö on seotud EUROMODi andmestikuga. Meie ülesanne on panna registrite põhjal kokku kogu rahvastiku sissetulekute, toetuste, maksude, tööhõive ja demograafilised andmed.
Andres Kukke: EUROMOD on Euroopas välja töötatud mikrosimulatsiooni mudel, millega on võimalik hinnata poliitiliste otsuste mõju. Näiteks, kui valitsus otsustab kehtestada mingi muudatuse, on vaja hinnata, mida see kulude ja tulude mõttes tähendab. Kõige kuumem näide hetkel – pensionireformi tuules oleks vaja hinnata, kuidas see mõjutab vaesuse määra. Või kui erakonnad annavad valimiste eel lubadusi, saame analüüsida nende mõjusid.
Hiljuti saime majandus- ja kommunikatsiooniministeeriumilt ülesande uurida koroona mõju turismiga seotud majandusharudele. Küsimus on selles, kui turismisektor on hetkel madalseisus ja seda tuleks toetada, siis mis on järgmised valdkonnad, kuhu koroonakriisi mõju viitega jõuab. Turismisektori mõju majandusele on väga laialdane, sest langus majutuses ja toitlustuses mõjutab omakorda ettevõtteid, mis toodavad kaupu või osutavad teenuseid turiste teenindavatele ettevõtetele, näiteks suveniiride valmistajatele, toidutootjatele, transpordifirmadele.
Analüüsime ka Eesti majanduse väärtusahelaid, et välja selgitada rikkuse valemit – kes teenib oma äritegevusega raha ja kes mitte. Lisaks on meie suur soov arendada andmekirjaoskust, et üha rohkem Eesti inimesi suudaksid andmeid lugeda, neid tarbida ning enda kasuks tööle panna.
Kellele statistikaameti eksperimentaalstatistika tiim oma teenuseid pakub?
Kaja Sõstra: Seni on peamiseks tellijaks olnud avalik sektor – ministeeriumid ja nende allasutused, Ettevõtluse Arendamise Sihtasutus. Erasektorist on olnud väiksemaid päringuid, näiteks soovis üks ehituskaupade kett teada nende valdkonnas tegutsevate ettevõtete kogukäivet, et saada aimu, kuidas nende ettevõte areneb võrreldes konkurentidega. Mikroandmeid ei tohi me välja anda, kuid konkurentide summaarsed andmeid küll.
Andres Kukke: Soovime edaspidi panustada rohkem kodaniku ja ettevõtja suunal, mille esimeseks sammuks oli palgarakendus. Praegu küsitakse meilt tihtipeale andmeid, kuid me ei soovi olla ainult andmete andjad, vaid pakkuda oma teadmisi ja oskusi, et eri andmeallikatest infot otsida ja leida andmetest uusi seoseid.
Soovime istuda nende laudade taga, kus alles hakatakse arutama ja planeerima, mis andmeid ja uuringuid on vaja teha. Olla juures, kui ministeeriumid arengukavasid arutavad ja planeerivad. Veidi on seda juba ka olnud.
Mis töid on eksperimentaalstatistika tiimilt võimalik tellida?
Andres Kukke: Töid, mis seletavad ühiskonnas nähtusi ja mille kohta on olemas andmed. On palju võimalusi, kuidas meie käsutuses olevaid andmeid kasutada. Meie käest on võimalik tellida nii kirjeldavat statistikat, seletamaks mis juhtus, kui ka mõjuanalüüse ja mudeleid. Vajadusel saame leitud seosed visualiseerida rakenduses, luua vastavad kalkulaatorid või algoritmid, mis aitavad mõjusid seletada ja prognoosida.
Kuidas te oma töö tulemuslikkust hindate?
Andres: Mõnede tööde headust saab hinnata sellega, kui klient soovib seda edaspidi regulaarselt saada. Sel juhul suuname töö meie põhitootmisliinile. Näiteks e-residentide majandusnäitajate analüüs oli algusest peale kavandatud pidevaks ning järgmise aasta alguses loodame selle töö ettevõtlus- ja põllumajandusosakonnale üle anda.
Mis tegevused on olnud kahel tegutsemisaastal kõige edukamad?
Kaja: Ilmselt palgarakendus, mida on palju kasutatud ja hästi omaks võetud.
Andres: Kõige suurem saavutus on see, kuidas tiim areneb. Lahendused tulevad inimeste hea meeskonnatöö tulemusel. Ka meie blogilood on saanud väga suurt kajastust. Kui andmed jõuavad lugudesse ja sealt edasi aruteludesse, siis on meie töö hästi tehtud.
Vaata eksperimentaalstatistika tehtud ja käimasolevaid töid siit.