Sondage (statistique)
From Wikipedia, the free encyclopedia
Un sondage est une méthode statistique visant à évaluer les proportions de différentes caractéristiques d'une population à partir de l'étude d'une partie seulement de cette population, appelée échantillon. Les proportions sont déterminées avec des marges d'erreur, dans lesquelles se situent les proportions recherchées avec telle ou telle probabilité.
Par métonymie, le mot sondage désigne également le document présentant les résultats de l'étude par sondage.
Les sondages les plus connus du grand public portent sur des populations humaines. Ce sont en particulier les sondages d'opinions réalisés par des entreprises de sondage. Mais il ne s'agit là que d'une application particulière de la technique du sondage, dont l'usage est beaucoup plus général (voir aussi échantillonnage).
Pour réaliser un sondage juste et adapté à la population visée, il faut choisir la technique d'échantillonnage adéquate. Il existe en effet de nombreuses méthodes permettant de créer un échantillon représentatif de la population mère. Il y a dans un premier temps les techniques probabilistes puis les techniques non probabilistes. Dans le premier cas, les individus de la population sont tirés au hasard et ont par conséquent tous une probabilité, égale ou non, de figurer dans l'échantillon. Dans le cas d'un échantillonnage non probabiliste, tous les individus n'ont pas forcément une probabilité non nulle de figurer dans l'échantillon.
Fondement théorique
Soit un échantillon aléatoire de grandeur et sa moyenne. Le théorème central limite dit que si est grand alors suit approximativement une distribution normale avec moyenne (la moyenne dans la population) et variance où est la variance des éléments de la population[1] (et son écart-type). L’intervalle de confiance à 95 % est . Cet intervalle peut être calculé si on connaît . L’estimateur sans biais est où est la variance des éléments de l’échantillon et son écart-type. L’intervalle de confiance devient alors .
Si est petit et la population suit une loi normale alors l’intervalle de confiance est construit en utilisant la loi de Student.
Différentes applications
Parmi les premières applications des sondages, on relève leur utilisation dans le cadre de stratégies de marketing. Les entreprises ont profité de cette technique pour optimiser le ciblage des attentes de leurs consommateurs. Avec la création de l'American Institute of Public Opinion, et un premier sondage d'intention de vote en amont de l'élection présidentielle américaine de 1936, cette technique s'affirme déjà comme un précieux outil à l'usage de la décision politique. Aujourd'hui, le monde politique ne peut plus s'en passer : le sondage est devenu l'un des principaux instruments d'aide à la décision, comme le note Brice Teinturier, directeur général délégué de l'entreprise de sondages Ipsos.
Méthodologie
Domaine politique
Réglementation française
En France, les enquêtes dédiées aux intentions de vote font l'objet de critiques sur leur biais de méthodologie qui « expliquerait les écarts entre les sondages et les résultats »[2] et sont encadrées par la loi du 19 juillet 1977 qui oblige à les accompagner d’informations précises sur leur élaboration[3]. Leurs fiches de renseignement sont toutes disponibles sur le site de la commission des sondages[3], chargée de veiller au respect de la réglementation[3]. Les nombreux sondages effectués sur internet, destinés à de simples volontaires[3], sont réputés biaiser les résultats[3]. Malgré cela, la plupart des instituts ne fournissent pas de chiffres bruts[3], empêchant le public de savoir comment ont été « redressées » leurs chiffres, au motif du « secret industriel »[3].
Le nombre de sondages a augmenté depuis le début du millénaire à chaque quinquennat[3] : 193 sondages d’intentions de vote avant l’élection présidentielle de 2002, 293 avant celle de 2007, 409 avant celle de 2012, et 560 avant celle de 2017[3], soit un quasiment triplement en quinze ans[3]. Selon Bruno Cautrès, chercheur au CNRS et au Cevipof-Sciences Po « l’opinion étant fluctuante, le sondage ne capte qu’un instant T. ».
Selon Nonna Mayer, directrice de recherche au CNRS, les sondeurs font face à « trois difficultés : sociologique, avec le poids grandissant des précaires – près du tiers des inscrits – ; politique, avec le nombre inhabituel d’indécis ; et technique, les “access panels” des sondeurs ne pouvant pas atteindre les non-connectés »[2]. Ils doivent depuis longtemps gérer aussi ce qu'ils appellent « l’effet désirabilité », selon Gaël Sliman, directeur de l’institut Odoxa[2] : en raison du besoin de « plaire », à l’intervieweur, une partie des sondés dissimulent leur intention de vote pour les partis jugés plus proche des extrêmes[2].
Spirale du silence
La sociologue Elisabeth Noelle-Neumann avait théorisé dans les années 1970 la « spirale du silence »[2] d'individus n'exprimant pas d'intention, pendant la plus grande partie de la campagne électorale, pour « ne pas se retrouver isolés dans leur environnement social »[2]. Pour cette raison, le principal « vote sous-déclaré » fut le vote communiste jusqu’en 1981[2], puis le vote Front national ensuite, selon Frédéric Dabi, de l’Ifop[2], même si depuis les années 2010, les instituts de sondages « ne redressent pratiquement plus » le parti de Marine Le Pen[2].
Tous les sondages doivent, selon Bruno Cautrès, chercheur au Cevipof, respecter la « méthode des quotas » consistant à confectionner « une France en miniature réalisée à partir des chiffres de l’Insee : le même pourcentage de femmes, d’hommes, de classes d’âge, de professions, de niveaux de diplôme et de répartition géographique »[2].
Sous-représentation de l'électorat jeune et populaire
Le biais le plus souvent évoqué est de « sous-représenter un électorat moins politisé et moins informé, généralement plus jeune, qui ne se décidera qu’au dernier moment »[3], car les instituts mesurent le plus souvent seulement les « intentions de vote »[4]. Au plan sociologique, les électeurs « qui se décident le plus tard sont essentiellement dans les catégories populaires »[2]. Les sondages ne portent, sauf exception, que sur les personnes « certaines » d’aller voter[4], en proposant au sondé de se situer sur une échelle de 1 à 10[4], ce qui réduit parfois l’échantillon des répondants de moitié[4] et le concentre sur un profil sociologique moyen plus socialement favorisé[4], plus âgé[4], et plus politiquement motivé que l’ensemble de la population par la politique en général ou par l'actualité du moment[4].
Par ailleurs, les différents instituts n'ont pas la même définition de la « certitude »[4] : en France, pour Ipsos-Sopra Steria et OpinionWay, seule la note 10 garantit la certitude d’aller voter[4], alors pour l'Institut Elabe c’est dès le 8[4]. Les intentions de vote des électeurs « certains » d’aller voter écartent les indécis[4], les incertains[4], et ceux qui le plus souvent, ou bien dans un contexte particulier, ne se décident que tardivement[4]. Ainsi, « une catégorie d’électeurs passerait systématiquement sous les radars » des instituts de sondages[2].