Martin Ehala: kas küsida kõigilt või mõnedelt

  • Statistikaameti ja teadlaste vastasseis on väldanud juba üle aasta.
  • Vaidlus käib 2021. aasta rahvaloenduse metoodika täpsuse üle.
  • Tänane Meie Eesti (9.12.19) toob esile debati machiavelliliku olemuse.
Martin Ehala. FOTO: Konstantin Sednev

Eelmisel nädalal esitas 36 teadlast ja akadeemikut valitsusele avaliku märgukirja, et statistikaameti kava teha rahvaloendus registripõhiselt ei ole usaldusväärne.

Teadlaste ja statistikaameti vastasseis on püsti juba üle aasta, eelmise nädala märgukiri ei ole esimene kollektiivne vastulause. Et küsimus on nii või naa ületanud uudisekünnise, on hea saada ülevaade sellest, mis on kaalul.

Täielikult registripõhine loendus tähendab, et inimesed ise ei anna vastuseid, ei internetis ega kodu külastavale loendajale, ning kõik andmed rahvastiku kohta saadakse olemasolevatest andmekogudest, nagu rahvastikuregister, kataster jt. Teadlaste hinnangul ei ole selline meetod usaldusväärne, sest osa andmeid registrites üldse pole ja osa on ebatäpsed.

Statistikaamet on sellega nõus ja ütleb, et puuduste kõrvaldamiseks tehakse lisaks valimiuuring. Valimiuuring on selline, kus ei küsitleta kõiki inimesi, vaid üksnes väiksemat hulka (statistikaamet pakub, et 60 000 ehk umbes neli protsenti rahvastikust). Peale valimiuuringu plaanib statistikaamet poolikuid andmeid korvata matemaatilise mudeldamise teel. Mudeldamise tulemuseks ei ole paraku reaalse olukorra kirjeldus, vaid tõenäosuslik hüpotees selle kohta, milline see võiks olla. Teadlased ei ole ka selle lahendusega nõus. Nende argumendid on järgmised.

Esiteks, rahvaloenduselt saamata jäänud andmete asendamine valimipõhiste uuringutega ei anna tegelikkuse terviklikku ülevaadet, sest väikeste rahvastikurühmade esindajaid satub üldistuste tegemiseks valimisse liiga vähe. Näiteks ei saa valimiuuringutega andmeid väga eaka rahvastiku tervise ja toimetuleku kohta.

Teadlased ei ole põhimõtteliselt registripõhise rahvaloenduse vastu, vaid väidavad üksnes, et meie registrid ei ole veel nii täielikud, et kogu vajalikku infot nende põhjal kätte saada.

Teiseks, üleilmastumise tagajärjel suureneb hüppeliselt superdiversiteet, st nähtus, kus väga suur hulk väga väikesi etnilisi vähemusi moodustab ühiskonnas suure osa, mida pole valikuuringutega võimalik täpselt uurida. Ka on valimiuuringutega liiga keeruline ja kallis võrrelda keele- ja tervisenäitajaid kohalike omavalitsuste, piirkondade või üksikute asustusüksuste vahel.

Kolmandaks, rahvaloenduselt saamata jäänud andmete korvamine valimipõhiste uuringutega ei anna täpset tegelikkuse ülevaadet seetõttu, et mittevastanute andmetega pole võimalik arvestada. Kuna valimiuuringutele jätab vastamata tihti kuni 50 protsenti inimestest ja mittevastamine pole juhuslik, tekitaks see asjaolu saadud tulemustes süstemaatilisi moonutusi.

Neljandaks, prooviloendused on näidanud, et mitmete tunnuste poolest on registrite andmed väga puudulikud. Näiteks lasteta paare, kes ei ole oma kooselu registreerinud, oleks täielikult registripõhises loenduses tegelikust poole vähem, ligi 70 000 inimese võrra. Need valdavalt noored täiskasvanud oleks statistikaameti lahenduse puhul paigutatud elama üksi või mõne leibkonna juurde, mis aga võib moonutada kuni paarisaja tuhande inimese leibkonna- ja perekonnaandmeid. Ei pea olema eriteadlane, et mõista, et sedavõrd suure vea puhul ei saa rahvaloendust enam pidada usaldusväärseks ühiskonnaprotsesside kajastajaks.

Probleemi ei ole teadlaste hinnangul võimalik lahendada mudeldamisega, sest see toob kaasa tulemuste suure ja süstemaatilise moonutuse: kooselupaaridest suudetaks tuvastada umbes 85 protsenti, pereloomeeas rahvastiku puhul aga alla 70 protsendi.

Samas ei ole teadlased põhimõtteliselt registripõhise rahvaloenduse vastu, vaid väidavad üksnes, et registrid ei ole veel nii täielikud, et kogu vajalikku infot kätte saada. Selle korvamiseks soovitavad nad kasutada kombineeritud meetodit, millega loendusandmete enamik saadakse registritest, kuid andmed, mida registrites ei ole või mille kvaliteet ei ole rahuldav, kogutaks otse inimestelt mitte valimiuuringuga, vaid küsitletaks kõiki. Selline lähenemine välistaks ka matemaatilise mudeldamise vajaduse.

Saatsin teadlaste vastuväited statistikaametile ja palusin neil artikli mahus vastata, kuidas on kavas valimiuuringust ja mudeldamisest tulenevaid moonutusi kõrvaldada ja mispärast ei võiks kasutada kombineeritud loendamismeetodit. Statistikaamet vastas kõrvaloleva artikliga.

25.09.2021 27.09.2021
Loo tellimiseks pead olema sisse logitud Postimees kontole.
Logi sisse
Sul ei ole kontot?
Loo Postimees konto