Bij de recentste
#peiling van (oa)
#Knack wordt er vermeld: "met een maximale foutenmarge van 3%". Wat betekent dat precies? En wat is dan de fout op de gepeilde partijscores? Tinternet en een gediplomeerd wiskundige haalden het stof van mijn statistiekkennis. Volg even mee! 🧵1/n
Zo'n peiling is een steekproef: je kan niet iedereen bevragen, want dan kan je net zo goed elke maand verkiezingen houden. Hoe groter de steekproef met N respondenten, hoe kleiner de fout. Ruwweg gaat dit volgens 1/√(N). Voor N = 1000, geeft dit 0,032 = 3,2%. Bij 200 al 7%. 2/n
Die foutenmarge is niet absoluut. Het kan nog altijd zijn dat het echte stemgedrag buiten het gepeilde percentage + of - de fout valt. De betrouwbaarheid wordt meestal op 95% gelegd: als je 20 keer peilt, zullen 19 intervallen de onderliggende waarde bevatten. 3/n
Het betrouwbaarheidsinterval van een gepeild resultaat kan beschreven worden met de volgende formule. Hierin is p de fractie voor een bepaalde partij, z de z-score (bij 95% betrouwbaarheid is z = 1,96) en N het aantal bevraagden. 4/n
In een dictatoriaal éénpartijland, waar iedereen op dezelfde partij moet stemmen, is p = 100% = 1. Onder het wortelteken staat dan 1(1-1), zodat de fout 0 wordt. Wiskundig kan je aantonen dat je de grootste fout krijgt bij p = 50%. De formule wordt dan
Voor N = 1000 krijg je dan die ±3,1% bij een peiling van 50%. Die 3,1% zijn procentpunten, dus het 95%-interval is van 46,9% tot 53,1%. Bij een peilresultaat van 25,5% heb je ± 2,7%, bij 8% heb je ± 1,7%, bij 1% heb je ± 0,6%. Voor kleine partijen is de absolute fout kleiner, maar de relatieve fout groter. Voor de splinterpartij met 1% loopt het interval van 0,4% tot 1,6%, wat een factor 4 scheelt! Scoort een partij 4% bij N = 300, dan gaat het van 1,8 tot 6,2% (onder tot boven kiesdrempel!) 6/n