Temporális és regionális összehasonlítások lehetséges torzításai
Absztrakt
Absztrakt A tanulmány arra keresi a választ, hogyan érdemes kezelni az adathiányt abban az esetben, ha időben és/ vagy térben elnyúló adataink vannak. Amellett érvelünk, hogy időben és térben kiterjedt adatok esetében több olyan egyedi szempont is felmerülhet, ami eltérő válaszadói struktúrát eredményezhet az adatfelvételek között. Az empirikus elemzésben a European Social Survey (ESS) 7 hullámának és 14 országának adatait felhasználva vizsgáltuk meg (N=185 049), hogy egy rendszerellenességet mérő index esetében mekkora volt az adathiány országonként és hullámonként. Az ESS adatok nagy szórást mutattak abban, hogy a vizsgált rendszerellenesség indexet alkotó változók között mekkora volt az adathiány: általában a nyugati és a skandináv országokban magasabb volt az érvényes válaszok aránya, míg keleten és a mediterrán országokban alacsonyabb. A többszintű regressziós modellek azt mutatták, hogy a nem-válaszolás közötti különbség nagyjából 3 százalékáért felel az ország és az adatfelvétel hulláma, míg egyéni szinten a rosszabb szociokulturális környezet magasabb nem-válaszolással jár együtt, akárcsak az, ha a válaszadó nő vagy idősebb. A nem-válaszolás kezelésének több forgatókönyvét is teszteltük, és bár összességében hasonló képet mutattak, de a pótolt adatokat tartalmazó index magasabb rendszerellenességet mutatott, mint a nem-válaszolók kihagyását követő stratégia. Az adathiány természetes velejárója az elemzéseinknek, és ha tudatosan nem foglalkozunk vele, akkor is kezeljük valahogy. Ez a kezelés sok esetben a használt statisztikai programok működési módjából következik. Ha nem akarjuk, hogy a programok vezessenek minket, alakítsunk ki egyértelmű protokollt a nem-válaszolás kezelésére, mert ez lehet a záloga annak, hogy az eredményeink érvényesek és megbízhatóak legyenek. Kulcsszavak: nem-válaszolás, adatpótlás, ESS, többszintű elemzés, rendszerellenesség