Campionamento probabilistico
Campionamento probabilistico procedura di campionamento che presuppone che per ogni elemento di una popolazione finita esista una probabilità misurabile e non nulla di essere incluso nel -> campione. Unico metodo completamente oggettivo per il campionamento delle popolazioni (consente infatti di valersi in modo legittimo delle teorie della probabilità), ha però alcuni limiti: la difficoltà di trovare liste complete da cui estrarre il campione e attendibili per uno spettro così ampio; il costo connesso, nell’eventualità che gli elementi da raggiungere siano distribuiti su un territorio molto vasto. Qui di seguito, si indicano le metodologie più diffuse.
• Campionamento a fasi (multi-phase sampling): da una popolazione si seleziona un campione; da quest’ultimo si seleziona un successivo campione per altre analisi statistiche; dal secondo campione se ne estrae, eventualmente, un terzo ecc.
• Campionamento a grappoli (cluster sampling): le unità della popolazione sono divise in più gruppi (grappoli o cluster), di cui viene stilato un elenco per poterne scegliere un campione casuale; da questi diversi gruppi si estraggono alcune o tutte le unità statistiche.
• Campionamento a stadi (multi-stage sampling): implica un procedimento di selezione a più livelli, da ognuno dei quali viene estratto un campione fino a ottenere delle unità elementari che costituiranno il campione definitivo. La popolazione è suddivisa in gruppi similari di unità statistiche di primo livello (es. regioni), poi si seleziona un campione di tali gruppi (unità statistiche dette II ausiliarie”) e all’interno delle unità statistiche di primo livello si scelgono una o più unità di secondo livello (es. province) e così via, fino alle unità statistiche elementari, oggetto della rilevazione. Il metodo viene usato quando la popolazione da indagare è molto ampia e distribuita sul territorio.
• Campionamento casuale semplice (simple random sampling): con questo metodo si attribuisce un numero a ciascuna unità della popolazione e si scelgono quindi gli elementi del campione tramite la tavola dei numeri casuali o altre procedure (schema di estrazione da urne e simili) che garantiscano l’imprevedibilità di un risultato tra tanti possibili, e che assicurino la medesima probabilità di estrazione a tutte le unità.
• Campionamento casuale stratifìcato (stratifìed sampling): la popolazione viene suddivisa in strati (gruppi omogenei), da ciascuno dei quali viene estratto un sottocampione casuale e indipendente. All’interno dei diversi gruppi i caratteri da rilevare presentano una variabilità inferiore a quella della popolazione nel suo complesso. L’estrazione del campione dai vari strati può essere: uniforme, quando a ogni strato viene assegnato lo stesso numero di unità campionarie; proporzionale, quando l’assegnazione delle unità campionarie ai singoli strati viene eseguita proporzionalmente al numero delle unità che compongono lo strato; non proporzionale, quando le percentuali degli strati sono differenti dai rapporti tra gli strati della popolazione di riferimento; ottimo, quando l’assegnazione delle unità viene effettuata sulla base della variabilità del carattere studiato all’interno dello strato e del numero di unità che lo compongono. • Campionamento fisso: nel caso di popolazione stabili, si estrae da queste un campione che è mantenuto fisso e dal quale vengono estratti in modo casuale dei sottocampioni a necessità.
• Campionamento per area (area sampling): il campione è costituito in base alle superfici territoriali entro o sopra o sotto le quali si intende osservare un fenomeno, individuate con criteri probalistici. L’insieme di aree da campionare è detta lista e le aree della lista coprono, senza sovrapposizioni, il territorio di riferimento, individuate con criteri probabilistici. Alla formazione di campioni per area, utilizzati nelle indagini ecologiche, si estendono i principi del campionamento a stadi.
• Campionamento sistematico (pattemed sampling) una volta ordinate e numerate (partendo da 1) le unità della popolazione, le unità campionarie vengono estratte secondo un modulo dato dal rapporto tra la dimensione della popolazione e la dimensione campionaria. Per esempio:
1) si calcola l’intervallo di campionamento, rapportando gli elementi della popolazione al numero di elementi che devono essere presenti nel campione;
2) si sceglie casualmente un numero compreso fra 1 e l’intervallo di campionamento,
3) si estraggono gli elementi corrispondenti al numero scelto in modo casuale e agli altri ottenuti sommando al primo numero l’intervallo di campionamento (es. se il numero scelto è 3 e l’intervallo 20, gli elementi scelti saranno quelli corrispondenti alle posizioni 3, 23, 43, 63 ecc, fino a raggiungere il numero di elementi desiderato per il campione).