5
(i) Données d’identification : ce sont les renseignements de la base de sondage qui
identifient sans ambiguïté chaque unité de l’échantillon, par exemple, le nom et
un numéro d’identification unique.
(ii) Données de communication : ce sont les renseignements nécessaires pour situer
les unités de l’échantillon pendant la collecte, par exemple, l’adresse postale ou
le numéro de téléphone.
(iii) Données de classification : ce sont les données servant à l’échantillonnage et,
éventuellement, à l’estimation. Les données de classification comprennent une
classification géographique (par exemple, province, division de recensement),
classification type des professions ou des industries (par exemple, le Système de
Classification des Industries de l’Amérique du Nord, SCIAN).
On distingue deux types de base de sondage : les bases listes et les base aréolaires.
(i) Base liste : Une base liste peut être définie comme une liste conceptuelle ou
physique de toutes les unités de la population d’enquête. Voici des exemples de
bases listes :
1.2.3 registre des statistiques de l’état civil (par exemple, une liste de toutes les
naissances ou de tous les décès dans la population);
1.2.4 registre des entreprises (liste de toutes les entreprises en opération) ;
1.2.5 registre des adresses (liste de logements avec adresses civiques);
1.2.6 annuaire téléphonique.
(ii) Base aréolaire : Une base aréolaire est une liste spéciale dont les unités sont des
secteurs géographiques. La population observée est située dans ces secteurs
géographiques. Les bases aréolaires sont habituellement composées d’une
hiérarchie d’unités géographiques. Des unités de la base de sondage à un niveau
donné peuvent être subdivisées pour former des unités au niveau suivant. Les
grandes régions géographiques comme les provinces peuvent être composées de
districts ou de municipalités qui peuvent être également divisés en plus petits
secteur, par exemple, les îlots d’une ville.
Si chaque élément de la base de sondage correspond à un et un seul élément dans la
population cible, on dira que la base de sondage est parfaite. Autrement, la base est
défectueuse, ce qui aura vraisemblablement un impact sur la qualité des estimations. En
pratique, une base parfaite n’existe pas. Il y a toujours des imperfections dont nous
décrivons maintenant la nature :
(i) Sous-couverture : La sous-couverture (ou sous-dénombrement) est le résultat de
l’exclusion de la base de sondage de certaines unités qui font partie de la
population cible. Par exemple, les nouvelles entreprises font partie de la
population cible mais sont absentes de la base de sondage (registre des
entreprises) car celle-ci n’a pas été mise à jour depuis la création de ces