Statistikaameti andmekool #14: kuidas statistikaamet teab, et ma elan tegelikult Tartus, mitte Põlvas?

Blogi
Postitatud 17. oktoober 2024, 9.23

Täpsest elukoha infost sõltub nii inimeste paiknemise, siserände kui ka leibkondade ja perekondade statistika täpsus. Täpsest statistikast oleneb aga, milliseid otsuseid saavad teha riik ja kohalikud omavalitsused. Alates 2022. aastast määrab statistikaamet iga Eesti inimese alalise elukoha erinevate registrite põhjal, kasutades paiknemisindeksi metoodikat.

Kuidas kogutakse Eesti elu puudutavaid andmed ja mida nendega tehakse? Kuidas saab rahvaloendusel kõik Eesti inimesed üles lugeda, kui minu ukse taga ei käinud keegi? Kuidas minu elu sellest paremaks muutub, kui SKP-d arvutatakse? Statistikaameti blogisari „Andmekool“ tutvustab ameti tööd ja statistika tegemist lähemalt!

Alates sellest, kui riigid hakkasid looma rahvastikuregistreid ehk rahvastikuandmeid sisaldavaid andmekogusid, tekkis võimalus nendes sisalduvat infot taaskasutada riikliku statistika tegemiseks. See andis võimaluse loobuda mahukatest ja kallitest uuringutest. 

„Kuid registriandmed ei ole ideaalsed,“ selgitas statistikaameti rahvastiku ja hariduse tiimi juht Terje Trasberg, miks tekkis ühel hetkel vajadus uue metoodika järele. Näiteks inimese rahvastikuregistrijärgne elukoht ei pruugi ühtida selle aadressiga, kus inimene tegelikult elab. 

Põhjuseid neile ebakõladele on Trasbergi sõnul mitmeid – kohaliku omavalitsuse poolt pakutavad hüved (nt tasuta ühistransport, praamipiletite soodustused) või ka heasüdamlik soov toetada maksurahaga oma kodukohta. Samas on elukoht aluseks paljudele rahvastikustatistika valdkondadele, näiteks siseränne ja leibkondade statistika ning seetõttu on oluline, et need andmed oleksid korras ehk võrreldavad. 

Üks pere, erinevad aadressid

Kõige tundlikum elukoha valesti registreerimise suhtes on leibkondade statistika. Registritel põhisevas statistikas moodustavad leibkonna samal aadressil elavad inimesed ning perekonna kaks või enam inimest, kes kuuluvad ühte leibkonda ja on üksteisega seotud abikaasadena, vabaabielupartneritena või vanema ja lapsena.

Trasbergi sõnul selgus 2016. aasta prooviloendusel, et rahvastikuregistri elukohtadele tuginedes erineb leibkondade ja perekondade statistika loenduse omast märgatavalt. Näiteks olid 2011. aasta loendusel 24% tuumperedest üksikvanemaga pered ja 76% abielu- või vabaabielupaaride pered. Neli aastat hilisemas prooviloenduses oli üksikvanemate peresid 41% ja paaridest moodustuvaid peresid 59%. „Seega: rahvastikuregistri elukohtade järgi on Eestis oluliselt rohkem üksikvanemaperesid kui tegelikkuses,“ võttis Trasberg probleemi kokku.

Moonutuse põhjus peitub rahvastikuregistri elukohaandmete kvaliteedis. Sageli elavad sama perekonna liikmed rahvastikuregistri andmetel erinevatel aadressidel.

Näiteks: kui kahe lapse ja kahe vanemaga peres on ema registreeritud samale aadressile ühe lapsega ning isa mõnele teisele aadressile teise lapsega, paistab registris olevat kaks üksikvanemaga perekonda. Et statistika poleks kallutatud, on Trasbergi sõnul oluline tuvastada pered ka siis, kui nad rahvastikuregistri andmetel koos ei ela. 

Elukoht statistikas = aadress, millega inimene on registrite põhjal kõige rohkem seotud

Et eksimisruum inimese tegeliku elukoha määramisel oleks võimalikult väike, töötas statistikaamet välja paiknemisindeksi, mis võtab inimese elukoha määramisel arvesse 18 erinevat andmeallikat, sealjuures rahvastikuregistrit. Inimese alaliseks elukohaks määratakse see aadress, millega ta on registrite põhjal kõige rohkem seotud. „Paiknemisindeks vastab korraga kahele küsimusele: kus ja kellega koos inimene elab. Teisisõnu, samal ajal suudab indeks tuvastada, kes kuuluvad inimesega koos samasse leibkonda ning kus nad kõik koos elavad,“ selgitas Trasberg.

Paiknemisindeksi töökäik on järgmine: eri andmekogudest kogutakse märke, mis võiksid viidata, kas kaks inimest elavad samas leibkonnas. Märgid (nt abielu, ühine kodulaen) võivad omavahel siduda partnereid, lapsi vanematega (märkideks lastetoetused, lastega seotud maksusoodustused) või üldisemalt, mistahes kaht inimest (märgiks sama auto kasutamine). Mõned märgid näitavad aga, et inimeste koos elamine on ebatõenäoline (lahutus, elatisvaidlus).

Ka on olulised märgid, mis seovad inimest mingite kohtadega, olgu need siis võimalikud elukohad (nt aadress rahvastikuregistris, omand, elektrivõrguga liitumise aadress), või märgid, mis näitavad lihtsalt, millises kandis inimene elab (nt perearst, töökoht, kool; apteek, kust on välja ostetud digiretsept). 

Edasi hinnatakse tõenäosust, et inimesed, keda mingi märk seob, ka tegelikult koos elavad. Tegeliku kooselamise info on teada suurtest leibkonnauuringutest: Eesti sotsiaaluuringust ja Eesti tööjõu-uuringust. Uuringuandmete põhjal hinnatakse mudeli parameetreid ning seejärel arvutatakse tõenäosused kõikidele registritest leitud isikute paaridele.

Sarnaselt arvutatakse tõenäosust, et inimene elab teatud kohas. Sealjuures võetakse arvesse nii seoste olemasolu konkreetse aadressi ja omavalitsusega kui ka kaugust isiku töökohast, koolist või lasteaiast.

„Aga tuleme nüüd tagasi eespool kirjeldatud perekonna juurde, mis rahvastikuregistri järgi tundus olevat jaotunud justkui kaheks üksikvanemaga leibkonnaks. Paiknemisindeks suudab inimeste vaheliste sidemete abil kindlaks teha, et tegemist on ühe perega. Ja nii võib välja tulla, et tegelikult elavad nad ikkagi kõik koos,“ rääkis Trasberg. Viimasel rahvaloendusel 2021. aastal kasutas statistikaamet muu hulgas paiknemisindeksi metoodikat. Loendusel selgus, et üksikvanema peresid oli 18% kõigist leibkondadest. Eesti sotsiaaluuringus oli neid samal ajal 16%, kuid rahvastikuregistris aga hoopis 38%. Seega sai jällegi kinnitust oletus, et rahvastikuregistri elukohtade järgi on Eestis oluliselt rohkem üksikvanemaperesid kui tegelikkuses.

Joonistus perekonnast, pilt on illustreeriv

Paiknemisindeksi metoodika ei mõjuta inimeste andmeid registrites

Statistikaameti eesmärk on toota statistikat elanikkonna kohta. See kehtib ka paiknemisindeksi kohta ehk indeksi tulemit kasutatakse ainult statistika tegemise eesmärgil ning see ei mõjuta infot, mille inimesed ise enda kohta registritesse kirja on pannud.

Kui rahvastikuregistrijärgne elanike arv näitab kohaliku omavalitsuse maksubaasi suurust, siis paiknemisindeksi eesmärk on hinnata inimeste ja leibkondade arvu, kes tegelikult kohalikus omavalitsuses elavad, et riik tervikuna ja kohalikud omavalitsused oskaksid oma ressursse planeerida ja otsustada, milliseid prioriteete seada.

Enda registeertutud elukoha infot on võimalik kontrollida e-rahvastikuregistris

Paiknemisindeksi metoodikat on kirjeldatud metoodikadokumendis

Registrite põhjal arvutatud ja küsitluses öeldud elukohtade kokkulangevust kirjeldava tabeli leiab statistika andmebaasist

Vaata ka aadressiandmete kasutamise selgitust maa-ameti lehet

 

Statistikaameti andmete ja graafikute kasutamisel palume viidata allikale.

 

Täpsem teave:

 

Heidi Kukk
meediasuhete juht
statistika levi osakond
statistikaamet
tel 625 9181
press [at] stat.ee (press[at]stat[dot]ee)

 

Artikli avapilt: Shutterstock