Ene-Margit Tiit: rahvaloenduse ajaloost ja tulevikust

Uudis

Postitatud 26. veebruar 2021, 7.55 , statistikaameti rahvastikustatistika ekspert Ene-Margit Tiit

Rahvaloendus on inimajaloo vanim statistikatöö. Aastatuhandete vältel on muutunud loenduse metoodika ja täpsustunud selle eesmärgid. Täienenud on ka andmete loetelu, mida inimeste kohta teada soovitakse, alustades haridustasemest ja pereinfost, lõpetades elutingimuste ning omandiga. Peamine loenduse eesmärk on jäänud siiski samaks ehk soov saada teada riigi, vahel ka linna või muu piirkonna elanike arv.

Piiblis on kirjeldatud 2000 aasta tagust rahvaloendust, mille puhul pidid mehed reisima oma sünnilinna, et panna kirja ennast ja oma perekonda. Veelgi vanem rahvaloendus Ateenas toimus märksa lihtsamalt: iga linnaelanik pidi tooma linna keskväljakule kivikese, mille järel lugesid ametnikud need üle. Märkimisväärne on, et loenduste korraldamine osutus võimalikuks siis, kui oli arenenud piisavalt võimas arvusüsteem, mis sisaldas küllalt suuri arve ning võimaldas kõige lihtsamate arvutustehete sooritamist ja esitamist. Kirjaoskuse olemasolu polnud selleks aga vajalik ja nii võibki oletada, et algeline andmeteadus võib olla vanem kui kirjatarkus.

Mitme tuhande aasta eest toimunud rahvaloenduste andmete ülestähendusi kiilkirjas ja savitahvlitel on leitud nii Egiptusest kui ka Mesopotaamiast, aga ka Hiinast. Lõuna-Ameerika rahvad jäädvustasid loendusandmeid värviliste taimejuurte kimpudena.

19. sajandiks oli rahvaloenduste tegemine Euroopas saanud võrdlemisi tavapäraseks. Selleks ajaks oli välja kujunenud ka statistika kui teadusharu, mille esindajad eri riikidest omavahel suhtlesid ja ideid jagasid.¹ Brüsselis toimus 1853. aastal esimene rahvusvaheline statistika kongress, millel osales ligi poolsada teadlast eri riikidest, sealhulgas mitu Tartu Ülikooli õppejõudu. Konverentsi eesmärk oli ühtlustada andmete kogumise metoodikat, lisaks töötati välja ühised printsiibid rahvaloenduste korraldamiseks. Neid põhimõtteid rakendatakse peaaegu muutmata kujul tänapäevani. Olulisemad neist nõuetest on:

ühtne fikseeritud loendusmoment;
ühesugused küsimused kõigile loendatavatele;
loendatava kogumi kõikne kaetus;
loenduste toimumise regulaarsus.

Möödunud sajandi keskpaigast koordineerib rahvaloendusi ÜRO, mis taotleb rahvaloenduste toimumist kogu maailmas enam-vähem ühel ajal iga kümne aasta möödudes. Euroopa Liidus koordineerib rahvaloendusi Euroopa Statistikabüroo Eurostat, mis määrab kõigi liikmesriikide jaoks selle, mida soovitakse kindlasti teada saada, samuti loenduse toimumise aasta. Lisaks nähakse ette metoodika täpne kirjeldamine ja tulemuste kvaliteedi hindamine liikmesriigi statistikaameti poolt.

Traditsioonilistest meetoditest tänapäevasteks

Tänapäeval kogutakse rahvaloendustel elanike ja nende elutingimuste kohta võrdlemisi palju andmeid. Seetõttu kasutatakse andmete kogumiseks tavapäraselt ankeeti, mis tuleb täita igal vastajal, leibkonnal või perekonnal. Täitjaks on seejuures üks pereliikmetest (vahel nõutakse, et see isik oleks leibkonna- või perekonnapea). Kui tegemist on rahva ja eluruumide loendusega, siis tuleb täita ka eluruumi ankeet.

Pikka aega kasutati peamiselt paberankeete, mida täideti tindi või pliiatsiga. Vahel olid paberankeetide asemel kasutusel ka kartongist kaardid, mida oli hõlpsam sorteerida ja loendada. Andmete töötlemisel kasutati esialgu vastavalt tunnustele lihtsalt kaartide või ankeetide käsitsi sorteerimist, mille järel kanti tulemused tabelitesse. Juba enam kui saja aasta eest võeti kasutusele mehaanilised arvutusmasinad. Rahvaloenduse andmed olid ühtlasi esimesed, mida töödeldi nii mehaanilistel kui ka elektroonilistel arvutitel. Tehnika arenedes võeti ankeedi täitmisel kasutusele masinloetavad pliiatsid², et lihtsustada andmete sisestamist. Alates möödunud sajandi keskpaigast töödeldakse loendusandmeid arvutite abil.

Küsitlusmetoodikat on tehnika areng samuti oluliselt mõjutanud. Klassikaline rahvaloendus toimus loendajate abil, kes ukselt uksele käisid ja loendatavaid intervjueerisid. Selliselt toimusid kõik rahvaloendused Nõukogude Liidus. Mitmel pool jäi ankeetide täitmine vastajate endi hooleks. Hiljem korjasid loendajad ankeedid kokku (nii tehti Eestis 1922. aastal) või saadeti need loenduskeskusesse posti teel. Selle meetodi edasiarenduseks on loendusankeetide täitmine internetis, mis oli Eestis ulatuslikult kasutusel 2011. aastal. Juhul kui loendus tehakse loendajate abil, lihtsustab tänapäevane tehnika ka nende tegevust: paberankeedi asemel täidetakse ankeete arvutis või mõne muu nutiseadme abil, samuti kasutatakse loendustel telefoniküsitlusi.

Võrdlemisi levinud on ka mitmesugused kombineeritud loendusmetoodikad, mille korral näiteks osa inimesi loendatakse posti teel täidetud ankeetide abil ja neid, kes posti teel oma andmeid ei saatnud, küsitleb loendaja.

Registrite kasutamine riiklikus statistikas ja loendustel

Loendused on üldjuhul ressursinõudlikud ja toimuvad suhteliselt harva. Riikide vajadustest lähtudes hakati mõningaid andmeid registrites koguma ja säilitama. Näiteks on kogutud ja säilitatud andmeid maaomandite kohta (katastrid), samuti on kõrgklassi kuuluvate isikute sünnija põlvnemise andmed nn aadliregistris. Rootsi oli üks esimesi riike maailmas, kus kõigi elanike andmeid hakati kirikute registrites säilitama. Eesti allus 17. sajandil Rootsi võimule, siis hakati ka siin perekonnasündmusi kirikuraamatutesse üles märkima. See komme ei säilinud aga mõnede võimumuudatuste korral. Küll aga hakati Eesti Vabariigis sadakond aastat tagasi perekonnasündmusi märkima perekonnaseisubüroode registriraamatutesse. Praegu on Eestis hästi toimiv riiklike registrite süsteem.

Register ei ole aga mitte iga riiklik andmekogu, ehkki mõnedes riikides seda ka nii mõistetakse. Selleks et andmekogu oleks register, peab ta täitma järgmisi tingimusi:

kõik kirjed peavad olema identifitseeritavad;
register peab olema kõikne;
registris sisalduv teave peab olema regulaarselt uuendatav.

Eestis on registrites sisalduv teave identifitseeritud isikukoodide, aadressi identifikaatorite ja ettevõtte koodide kaudu. Need koodid võimaldavad ka eri registreid omavahel siduda.

Igal riiklikul registril on valdkonnasisene eesmärk. Üldiselt ei looda registreid statistika tegemiseks. Ometi on riiklikes registrites sisalduv teave edukalt kasutatav ka riikliku statistika tegemiseks, kusjuures see säästab oluliselt andmete kogumiseks kuluvaid ressursse. Alati pole registrites sisalduva teabe kasutamine aga lihtne: mõõdetavad tunnused ei tarvitse olla täpselt samad, mida kasutatakse statistikas, vahel on vaja registriinfo kvaliteeti kontrollida. Siiski on registrite kasutamisel statistikas olulisi eeliseid vahetu andmekogumise ees, eelkõige vähendab see inimlikke eksitusi ja subjektiivsust.

Registripõhise rahvaloenduse eripärad

Rootsi, Taani ja Soome statistikud märkasid juba möödunud sajandi lõpus, et registreid saab edukalt kasutada rahvaloenduste korraldamisel ning see võimaldab loobuda traditsioonilisest küsitlusest. Registripõhiselt on rahvaloenduse seni korraldanud veel Norra, Island, Austria, Holland ja Sloveenia. 2021. aasta loenduse kavatsevad registripõhiselt korraldada ka meie naabrid Läti ja Leedu. Eurostat toetab igati registripõhise rahvaloenduse korraldamist ja selleks on ka loenduse reeglid paindlikumaks muudetud.³

Kõige olulisem muutus registripõhise loenduse korral on see, et elanikelt ei ole võimalik midagi küsida. Loendus ei ole arvamusküsitlus, vaid selle eesmärk on fikseerida faktilist olukorda, seega üldiselt ei põhjusta see probleeme. Siiski on paar aspekti, mida ei ole enamikus riikides registritest võimalik leida. Üks selline küsimus on leibkonna koosseis juhul, kui kasutada majanduspõhist leibkonna määratlust ehk leibkonnaks loetakse isikud, kes elavad üheskoos ning kasutavad ühiseid raha- ja toiduressursse. See on küsimus, millele ka küsitluse puhul võidakse saada vastuolulisi vastuseid. Seega tuleb registripõhise rahvaloenduse korral loobuda isikute majandusliku seose uurimisest ja lugeda üheks leibkonnaks ühes eluruumis elavad isikud.⁴ Lääneliku elustiiliga riikides, kus iga leibkond püüabki omaette elada ja ühiskorterid on harv nähtus, on leibkonna eri definitsioonide kasutamisest tekkiv nihe võrdlemisi väike. Seda arvestades aktsepteerib ka Eurostat mõlemat leibkonna definitsiooni.

Teine oluline küsimus on seotud sellega, et kõik inimesed ei ela neis eluruumides, kuhu nad on registreeritud. Näiteks registreeritakse end elama kohta, kus võib saada hüvesid (õigus kasutada tasuta ühistransporti jms). Kui traditsioonilise loenduse korral saadi inimesed kätte nende tegelikust elukohast ja see ka kirja pandi, siis registripõhise loenduse korral on kasutatav üksnes registreeritud elukoht. Tänapäeval aktsepteerib Eurostat ka seda varianti.⁵

Registripõhise loenduse plussid ja miinused

Esimese registripõhise loenduse plussina saab välja tuua suure hinnavahe. Registripõhise loenduse korral ei ole tarvis kulutada ressursse elanike käest andmete kogumiseks, sest need on juba kogutud. Siiski tuleb tõdeda, et esimene registripõhine loendus on enamasti traditsioonilisest loendusest kallim, sest see eeldab väga põhjalikku eeltööd, näiteks registrite ja andmete transpordikanalite testimist ja korrastamist, samuti algoritmide koostamist. See kõik tähendab hinnanguliselt vähemalt kümmet aastat intensiivset tööd. Seevastu järgmiste loenduste korraldamine (eriti juhul, kui uusi küsimusi ei lisandu) on registripõhiselt märksa odavam, sest traditsiooniliste loenduste suurim kuluallikas on tänapäeval loendajate töötasu.

Murekoht on veel see, et registrid ei ole üldjuhul loodud statistika ja eriti loenduste vajadusi silmas pidades. Seetõttu erinevad registrites kogutud tunnused enamasti loendustel mõõdetavatest. See tähendab, et loendustunnuste määratlemiseks tuleb koostada algoritmid ja vahel kasutada ka mitut registrit. Näiteks inimese sotsiaalse seisundi määratlemiseks tuleb andmeid võtta kümmekonnast registrist.

Andmete olemasolu kõrval on oluline ka nende kättesaadavus. Siin võivad takistused olla nii juriidilised kui ka tehnilised. Tänapäeval lubavad Euroopa Liidu õigusaktid isikuandmete kasutamist statistika eesmärgil, seega põhimõtteliselt ei tarvitse andmete kasutamisel juriidilisi takistusi olla. Seda juhul, kui andmete liikumise käigus jälgitakse turvareegleid ja töödeldakse üksnes anonüümseid isikuandmeid. Võrreldes traditsioonilise loendusega on registripõhise loenduse korral võimalus isikuandmeid kaitsta siiski parem, kuna esimesel juhul peab loendatav paratamatult oma isikuandmeid loendajale teatama.

Kõige olulisem teema, mille ümber diskuteeritakse, on aga andmete täpsus. Küsimus on peaasjalikult selles, kui täpsed on registriandmed, sest tavaliselt eeldatakse vaikimisi, et küsitlusandmed on absoluutselt täpsed. Tegelikult see nii ei ole – küsitluse käigus võib tekkida juhuslikke vigu, lisaks sellele võivad vastajad anda tahtlikult valesid vastuseid.

Registriandmete ajakohasuse tagab nõue, et neid tuleb regulaarselt uuendada. Kasutamise käigus peaksid registrites välja tulema ka juhuslikud vead. Kui registrites on andmed dokumendipõhised, näiteks sünni- ja perekonnaseisuandmed rahvastikuregistris või haridusandmed hariduse infosüsteemis, siis on need üldiselt väga kõrge täpsusastmega, sest välistatud on ka tahtlikud moonutused. Teine lugu on aga inimese enda esitatavate andmetega, näiteks elukoha registreerimisega. Taoliste andmete puhul võib inimesele olla kasulikum, kui registris on ebaõiged andmed, et saada osa mõnest elukohapõhiselt jagatavast hüvest. Siiski pole selge, kas silmast silma antavas intervjuus on vastused õigemad ja sihilikke valevastuseid vähem kui registriandmetes. Oluline on ka registrite ristkasutusel põhinev võimalus andmeid täpsustada.

Teine väga oluline teema on kaetus. Tänapäeval on inimesed väga liikuvad ja neid on raske küsitlemiseks tabada. Samuti on järjest rohkem inimesi, kes vastamisest hoiduvad (kuigi loendusel vastamine on kohustuslik), sest ei soovi oma isikuandmeid riigiga jagada. Isegi kõige paremini korraldatud loendustel tekib vähemalt mõneprotsendiline alakaetus. Registripõhise loenduse puhul on see mure väiksem, kui pole just tegemist riigiga, kuhu toimub massiline illegaalne sisseränne.

Kokkuvõttes on kõik riigid, kus on registripõhine loendus toimunud, andnud loendustulemuste täpsusele kõrge hinnangu.

Valikuuring loenduse osana

Statistikas on valikuuringuid rakendatud viimase saja aasta jooksul, seda eeskätt mitmesuguste teadusuuringute puhul. Nende rakendamine ei kulgenud aga lihtsalt. Esialgu leidus teadlasi, kes valikuuringute põhjal saadud tulemuste usaldusväärsuses kahtlesid, kuigi nende puhul oli võimalik eksimise tõenäosust täpselt määrata. Lisaks teadusuuringutele rakendatakse valikuuringuid üha rohkem ka riiklikus statistikas, kusjuures kasutatakse võrdlemisi komplitseeritud valikueeskirju, mis võimaldavad saada soovitud täpsusega tulemusi võimalikult väikese ressursikuluga.

Viimasel ajal on valikuuringuid kasutatud ka loendustel ja selleks on kaks võimalust. Esiteks ei võimalda riigis olemasolevad registrid kõiki loendustunnuseid kätte saada. Sel juhul on võimalik võtta kasutusele kombineeritud loenduse meetod, kus üks või mõned loendustunnused hinnatakse valimi põhjal. Võimalik on nii varasema (kuid ajaliselt lähedase) või ka spetsiaalselt loenduse ajal tehtud valikuuringu kasutamine. Mitme loendustunnuse hindamise korral võib tekkida probleeme jaotuste kooskõlastamisega, selleks on aga välja töötatud sobiv metoodika.

Teine variant seostub lisatunnustega. Mõnes riigis soovitakse lisaks üleeuroopaliselt kooskõlastatud tunnustele mõõta ja uurida rahvaloendusel lisatunnuseid. Selleks kasutatakse tavaliselt valikuuringut, sest iga lisaküsimuse lisamine kõikse loenduse ankeeti suurendab oluliselt selle maksumust ja ei ole enamasti mõttekas. Sobivalt disainitud valikuuringuga on võimalik saavutada vajalik täpsus ja samuti seostatus loendusandmetega.

Suurandmed ja mudelid loendusel

Viimastel aastatel on järjest rohkem hakatud mitmesugustes uuringutes kasutama suurandmeid, mis saadakse teatavate protsesside käigus laekuvate andmete salvestistena. Näiteks on andmed mobiilikõnede või elektri kasutamise kohta koduses majapidamises. Tegemist on küll paljulubavate andmetega näiteks rändevoogude kindlakstegemisel ja hindamisel, aga esialgu on võimalus kasutada suurandmeid loendusel üsna piiratud, sest näiteks mobiiliandmed ei ole andmekaitse reeglite tõttu põhimõtteliselt identifitseeritavad.

Samas kasutatakse loendustel lähteks üksnes identifitseeritavaid andmeid, ehkki loenduse väljund on agregeeritud. See tähendab, et andmeid ei esitata üksikobjektide kohta, vaid ainult objektirühmade (näiteks ühe linna elanike või teatavas vanuses inimeste) kohta. Suurandmete kasutamine on siiski perspektiivikas mõningate loendustel kasutatavate mudelite korral, sellist lähenemist toetab ka Eurostat. Näiteks eelseisval loendusel kasutatakse Eestis elektri tarbimise andmeid selgitamaks eluruumide asustatust.

Rahvaloendused Eestis

Esimesed kümme rahvaloendust Eestis – alates 1881. aastast kuni 2000. aastani – toimusid traditsioonilisel viisil paberankeetidega ja loendaja intervjueerimisel. Üksnes 1922. aastal katsetati ankeetide isetäitmist. Linnade aadressbüroode andmeid kasutati küll loenduste ettevalmistamisel, kuid ankeedid täideti üksnes küsitlusel saadud andmetega.

Juba 2000. aastal, kui rahvastikuregister oli loomisel, hakkasid visionäärid rääkima rahvaloenduse korraldamisest registripõhisena. Enne 2011. aasta rahvaloendust tõusis loendusmetoodika teema tõsiseks diskussiooniallikaks. Vahetult eelnenud majanduslanguse perioodi tõttu otsis valitsus võimalusi korraldada loendus võimalikult odavalt ja paistis, et selleks oleks parim lahendus registripõhine loendus. Statistikaamet selle ideega ei nõustunud, sest esialgse analüüsi tulemusena oli selge, et registreid oli vaja veel kontrollida ja nende andmete kvaliteeti parandada, lisaks oli probleeme mõne loendustunnuse saamisega. Nii otsustatigi 2011. aasta rahva ja eluruumide loendus korraldada kombineeritud meetodil.

2011. aasta rahva ja eluruumide loendus

Juba 2011. aastal kasutati ulatuslikult riiklikke registreid nii loenduse ettevalmistamisel kui ka läbiviimisel. Loendusankeetidesse paigutati eeltäitmise korras registrist saadud andmed ning loendatavatel paluti neid kontrollida ja vajaduse korral parandada. Registreid kasutati ka loendustulemuste kontrollimisel ja parandamisel. Kui mõni ankeedi vastus sisaldas loogilist vastuolu, mis selgus alles hilisema kontrolli käigus, siis võrreldi seda vastava näitajaga registris ja vajaduse korral korrigeeriti. Samuti kasutati registreid loendusel ilmnenud andmelünkade täitmiseks. Väga oluline registrite rakendus oli ka loenduse alakaetuse hinnang, mille alusel moodustati edaspidi rahvastikustatistikas kasutatav rahvastiku üldkogum.⁶

Kombineeritud oli ka küsitluse metoodika. Esimest korda rakendati Eestis veebiküsitlust ja seejuures oli uudsusmomente kaks. Esiteks oli tegemist isevastamisega, mis erines oluliselt senistest Eestis toimunud loendaja läbiviidud intervjuudest. Teiseks täideti loendusankeedid internetis, mis nõudis eelnevat isikutuvastamist ID-kaardi või pangalingi abil. Kui veebiküsitluseks ettenähtud aeg läbi sai, toimus silmast silma intervjuu eluruumides, kus kas kõik või osa loendatavaid ei olnud ankeeti veebis täitnud. Intervjuud toimusid samuti varasemast erinevalt, kuna loendajad sisestasid vastused sülearvutisse. Lisaks määrati iga eluruumi jaoks ruumikoordinaadid ja seda tegi kas loendatav leibkond ise, kasutades ankeediga koos kuvatud kaarti, või loendaja, kelle ülesanne oli kahtluse korral ka eluruumide koordinaadid üle kontrollida. Avarii korral kasutatavaks varuvariandiks oli paberankeet ja eriti keerulistel juhtudel (näiteks väikesaarte puhul) tegid loendajad telefoniintervjuu. Üldiselt võib seda loendust metoodiliselt õnnestunuks lugeda, kuna veebis loendanute osakaal oli 67%, mis oli kõrgeim seni kogu maailmas tehtud loendustest.⁷ Alakaetus 2,3% oli samuti rahuldavalt madal.⁸

2011. aasta loenduse omapäraks oli mõõdetavate tunnuste suur hulk. Rahvaloendusega seotud küsimused olid üldsuse huviobjektiks ning paljud teadlased ja huvilised tegid ettepanekuid lisada standardsetele loenduse küsimustele täiendusi, mida oli umbes kolmandik isikuankeedist. Põhjendusega, et tegu on viimase küsitluse abil toimuva rahvaloendusega, need küsimused ka lisati. Loenduse omapära oli ka kolme kuu pikkune kestus. Selgus aga, et hoolimata veebiloenduse suurest osakaalust oli Eesti rahvaloendus üks maailma kallimaid. Põhjuseks oli loendusküsimuste suur arv ja elanikkonna suhteliselt hõre paiknemine.

Ettevalmistused registripõhiseks loenduseks

Kui selgus, et Eesti ei olnud 2011. aastal veel valmis registripõhist loendust korraldama, algas kohe ettevalmistustöö järgmise loenduse korraldamiseks registripõhiselt. Statistikaamet soovis loenduse ettevalmistustesse kaasata riigi teaduspotentsiaali ja nii valmiski aastatel 2010–2013 projekt „Registripõhise rahvaloenduse metoodika“, mida juhtisid Tallinna Ülikooli Eesti demograafia instituut ning konsultatsioonifirma Ernst & Young Baltic AS. Tulemuseks oli arusaam, et enne registripõhise loenduseni jõudmist tuleb registrites teha hulk töid, näiteks perekonnaseisuarhiivi digiteerimine ja tulemuste kandmine rahvastikuregistrisse või ameti info kogumine registrisse jne.⁹

Pärast seda jätkus metoodiline töö statistikaameti analüütikute ja metoodikute käe all. Eesmärgiks seati 2021. aasta rahva ja eluruumide loenduse registripõhine korraldamine, pidades silmas kõiki rahvusvahelisi, eeskätt Eurostati kehtestatud metoodilisi ettekirjutusi ning kvaliteedinõudeid. Selleks:

tehti aktiivselt koostööd riiklike registrite esindajatega ja juhiti tähelepanu puudustele;
koostati algoritmid loendustunnuste moodustamiseks registritunnustest;
töötati välja metoodika tegeliku rahvaarvu hindamiseks olukorras, kus välisränne on vaid osaliselt registreeritud;
loodi metoodika peretuumade moodustamiseks olukorras, kus suure osa neist moodustavad ametlikult registreerimata kooselupaarid;¹⁰
arendati välja metoodika elukoha andmete täpsustamiseks olukorras, kus arvestatav hulk riigi elanikest on oma elukoha valesti registreerinud;
korraldati mitu prooviloendust ja üks valikuuring originaalmetoodikate kontrollimiseks;
suheldi tihedalt rahvusvahelise kogukonnaga, sh eriti Eurostatis, tutvustati originaalmetoodikaid rahvusvahelistel seminaridel ja trükiväljaannetes.^{11, 12, 13, 14}

Mitmed Eesti statistikute metoodilised võtted on esitatud soovitustena Eurostati dokumentatsioonis.

2021. aasta rahva ja eluruumide loendus

Eestis tuntakse suurt huvi rahvaloenduse andmete vastu, sest need on kvaliteetsed, hästi korrastatud ja kättesaadavad. Ei saa unustada ka seda, et loenduse andmeid saavad teadlased kasutada tasuta, ise uuringuandmete kogumine oleks kallis ja vaevarikas. Lisaks on loenduste korraldajad olnud teadlaste soovide suhtes tähelepanelikud ja vastutulelikud, mistõttu on Eesti rahvaloendustel küsitud märksa rohkem lisaküsimusi, kui see rahvusvaheliselt kombeks on.

2021. aasta registripõhise loenduse ettevalmistamisel peeti Statistikaametis silmas eeskätt rahvusvaheliselt kohustuslikke loendustunnuseid, millele lisati mõned Eestis traditsiooniliselt mõõdetud ja analüüsitud tunnused, nagu rahvus ja emakeel. Registripõhise loenduse käigus ei olnud kavandatud selgitada välja elanike usulist kuuluvust (mis on rahvusvaheliselt tunnistatud delikaatseks küsimuseks ja millele vastamine on vabatahtlik), tervise enesehinnangut (mille kohta tehakse mitmesuguseid uuringuid lisaks Eestis toimivale e-tervise baasandmestikule), samuti võõrkeelte oskust (mida uuritakse mõningates valikuuringutes), sealhulgas ka murdekeelte oskust.

Tegemist on lisaküsimustega, mida tavapäraselt rahvaloenduste põhiküsimustikus ei küsita, kuid mida mõnes riigis mõõdetakse valimipõhise lisaküsimustiku abil. Seetõttu tegi Statistikaamet ettepaneku korraldada loendus kombinatsioonina registripõhisest põhiloendusest ning valikuuringust.

Esimene variant: registripõhine loendus koos valikuuringuga

Loenduse põhiprogramm täidetakse Statistikaametis aastail 2013–2020 välja töötatud originaalse registripõhise metoodika alusel, mille on heaks kiitnud ka Eurostat. Erinevalt eelmisest loendusest kasutatakse leibkonna eluruumipõhist määratlust, kusjuures isikute eluruumiks loetakse täpsustatud registreeritud eluruum, st registreeritud elukohta kontrollitakse ning vajaduse korral täpsustatakse teiste registrite info abil. Mõlemad muudatused seostuvad orgaaniliselt registripõhise loendusega. Loenduse üldkogum ehk loendatavate isikute arv määratakse registrite ristkasutusel põhineva täpsustatud metoodika järgi, mis võimaldab hinnata ka pendelrändajate arvu.

Lisaküsimused (keelte ja murrete oskus, tervise enesehinnang ning suhe religiooni) selgitatakse valikuuringu alusel, mille valimi disain arvestab vastajate soo, vanuse ja elukoha jaotust nii, et kõigis huvipakkuvates vastajate rühmades oleks tagatud soovitav hinnangutäpsus. Valikuuring tehakse veebi- ja küsitlusuuringuna.

Teine variant: registripõhine loendus koos kõikse lisauuringuga

Selle variandi puhul täidetakse loenduse põhiprogramm samuti Statistikaametis aastail 2013–2020 välja töötatud ja varem kirjeldatud originaalse registripõhise metoodika alusel.

Lisaküsimused (keelte ja murrete oskus, tervise enesehinnang ja suhe religiooni) selgitatakse kõikse uuringu ehk loenduse käigus, mis toimub samamoodi 2011. aasta loendusega veebi- ja küsitlusuuringuna. Ainus erinevus on, et loendusankeedil ei ole loenduse põhiküsimusi, ainult lisaküsimused.

See, kumma metoodika alusel loendus tegelikult tehakse, otsustatakse siis, kui selgub riigieelarvest eraldatav summa loenduse jaoks. Teise meetodi hinnatav maksumus on märkimisväärselt kõrgem, sest Eesti hajaasustuse tingimustes määrab küsitluse hinna peamiselt eluruumide vahel liikumine, seega ei muuda lühike küsimustik loendust märkimisväärselt odavamaks.

Variantide plussid ja miinused

Esimese variandi puhul on tegemist standardse valikuuringute metoodikaga, mille puhul kõiki jaotusi hinnatakse valimi disaini ja vastamismäära järgi. Kõigi hinnatud näitajate jaoks saadakse ka täpsuse hinnangud, mis on arvestatav eelis võrreldes traditsioonilise lähenemisega.

Teise variandi ehk kõikse uuringu puhul on andmetega esmapilgul lihtsam tegutseda. Probleem on see, et tõenäoliselt on tegemist alakaetusega, mis ilmneb niipea, kui küsitlusandmeid soovitakse linkida registripõhiste loenduse andmetega. See tähendab arvestatavat metoodilist lisatööd puuduvate väärtuste kompenseerimiseks, mis paratamatult kahandab mõnevõrra loendustulemuste täpsust.

Praktilise andmekasutuse seisukohast ei ole meetodite vahel olulisi erinevusi, kuid töömahukuse ja ressursikulu poolest on erinevus suur.

Artikkel on esmakordselt ilmunud ajakirja Õiguskeel 2021. aasta 1. numbris.

¹ Tiit, E.-M. Eesti rahvastik. Viis põlvkonda ja kümme loendust. Tallinn: Statistikaamet, 2011.

² Suurarvutitesse, mis olid tänapäevaste arvutite eelkäijad, sisestati andmed enamasti perfolintide või -kaartide abil. Erilise pliiatsi kasutamisel tekkis võimalus sisestada ka teatavat paberdokumentidele kantud infot

³ Visk, H. An index-based approach to determine partnership in register-based census. – Statistical Journal of the IAOS 2019, 35(2), lk 245–251.

⁴ Visk, H. (viide 3).

⁵ Tiit. E.-M. Leibkond ja perekond statistikas. – Akadeemia 2020, nr 2, lk 237–266

⁶ Tiit, E.-M., Meres, K., Vähi, M. Estimation of census population of census 2011. – Quarterly Bulletin of Statistics Estonia 2012, 3, lk 79–108.

⁷ Tiit. E.-M. 2011. aasta rahva ja eluruumide loendus. Metoodika. Tallinn: Statistikaamet, 2014, lk 19, 76.

⁸ Tiit, E.-M. Assessment of under-coverage in the 2011 Population and Housing Census. – Quarterly Bulletin of Statistics Estonia 2012, nr 4, lk 116–119.

⁹ Puur, A., Sakkeus, L. Aben, S.Registripõhise rahva- ja eluruumide loenduse (REGREL) metoodika väljatöötamine. Projekti lõpparuanne. Tallinn, 2013.

¹⁰ Tiit, E.-M. (viide 5).

¹¹ Tiit. E.-M. The register-based population and housing census: methodology and developments thereof. – Quarterly Bulletin of Statistics Estonia 2015, nr 3, lk 61–81.

¹² Tiit, E.-M., Maasing, E. Vähi, M. Residency index – a tool for measuring the population size. – Acta et commutationes Universitatis Tartuensis 2017, vol 21, nr 1, lk 129–139.

¹³ Tiit, E.-M. Residency Testing. Estimating the true population size of Estonia. – Statistics in Transition 2017, nr 2, lk 211−226.

¹⁴ UNECE. Guidelines on the use of registers and administrative data for population and housing censuses. 2017.

Kas leidsid, mida otsisid?