Comprendre les sondages

Publié le par Patricia Perennes

Ces dernières semaines, comme pendant toutes les campagnes électorales, on entend beaucoup parler de sondages. Ségolène Royale gagne 2,5%, elle remonte, Bayrou quant à lui s’envole, etc. Et inévitablement, surtout depuis le 21 avril, on entend en réponse « de toute façon les sondages c’est pipeau et compagnie ».

 

En tant qu’étudiante de l’ENSAE (Ecole Nationale de la Statistique et de l’Administration Economique), je souhaiterais expliquer le sujet aux néophytes, pour assainir le débat politique à ce sujet, et que les sondages ne soient plus cités/critiqués à tort et à travers.

 

Les sondages sont-ils fiables ?

Si l’on demande à quelqu’un s’il aime les yaourts de la marque X, ou le nouveau film de Brian De Palma, il va vous répondre franchement. Vous réunissez et « redresser »[1] les résultats et vous avez un résultat à une marge d’erreur prêt. Par exemple 20% des Français aiment les yaourts de la marque X, à plus ou moins 5%. Cela permet de se faire une idée de la taille du marché de la vente de yaourts.  

 

Il est important de noter que les sondages étant fondés sur des théories mathématiques solides d’une représentation fidèle de ce qu’on aurait obtenu en interrogeant toute la population française (à la marge d’erreur près).  

 

Pourquoi alors les sondages d’intentions de vote se trompent-ils souvent ?

Si les sondages commerciaux, comme nous venons de le voir, peuvent être fiables, il en va autrement des prévisions de vote. Pourquoi ? Deux raisons expliquent les difficultés des instituts de sondage en cette matière :  

 

  1. Les gens changent d’avis
  2. Ils mentent

 

1. Le fait d’aimer ou de ne pas aimer un yaourt ou un film est quelque chose d’assez stable. De toute façon, même si les « préférences des consommateurs » se modifient légèrement et mettons que ce ne soit plus 20%, mais 17% des Français qui aime tel ou tel produit, cela n’a pas de conséquences dramatiques. Au pire on aura surproduit un peu. Mais si Jospin fait 17% et pas 20% et que Le Pen a un score de 18% et pas 15%, les conséquences sont bien plus importantes.

 

Ce que les gens pensent voter maintenant n’est pas forcément ce que les gens voteront dans 2 mois, ou même quelques jours. Certains n’ont d’ailleurs pas la moindre idée de ce qu’ils vont voter et ne se décideront que dans l’isoloir. Heureusement d’ailleurs sinon l’engagement politique et les campagnes électorales n’auraient plus de sens.

 

Les sondages ne sont que le reflet de ce qui se passerait si les gens entraient dans l’isoloir au moment où on les interroge. Ce n’est pas ce qui se passera au premier tour. C’est d’ailleurs pour cette raison que les sondages sortie des urnes sont si fiables et que l’on peut savoir une minute après la fermeture des bureaux des votes qui a été élu : les sondeurs interrogent les électeurs au moment où ils votent, et n’interviewent que les gens qui ont effectivement votés.

 

2. Les gens mentent. Il est difficile, même à un enquêteur au téléphone de dire « Oui je vote Le Pen. Les noirs et les arabes dehors. » (Je caricature un peu). Le vote frontiste est donc sous-déclaré par rapport à celui des autres parties.

 

Les sondeurs, qui connaissent cet effet, corrigent donc les résultats. Comment ? À l’aide des enseignements tirés des élections précédentes. On sait par exemple qu’en l’année n, Le Pen a eu un score de 14%, alors que seulement 7% des sondés déclaraient avoir l’intention de voter pour lui. L’élection suivante, les proportions étaient de 8%/17%. Les instituts de sondages en ont conclu qu’il faut multiplier les intentions de vote pour Le Pen par un coefficient proche de 2. On voit bien les limites de ce genre de raisonnement. Que se passe-t-il si les Français changent de comportement et n’ont plus honte de déclarer le vote d’extrême droite ? Comment les sondeurs peuvent-ils anticiper cet effet ? Quel coefficient appliquer à Monsieur de Villiers ? Ces questions restent ouvertes.

 

Comment les instituts de sondages parviennent-ils à nous donner des chiffres censés refléter toute la population française en interrogeant 1013 personnes ?

Parfois, lorsqu’on lit le résultat d’un sondage dans la presse, on voit une petite mention au bas du tableau précisant « sondage réalisé par entretiens téléphoniques sur la base d’un échantillon de 1013 individus. 

 

Première porte ouverte à enfoncer : plus l’échantillon interrogé est faible moins les résultats sont solides (ie plus la marge d’erreur est importante). Si on interroge très peu de personnes, on va avoir une marge d’erreur très importante, et vis versa. A la limite en interrogeant un échantillon constitué de tous les votants, on aura une marge d’erreur de 0% (n’est-ce pas d’ailleurs ce que l’on fait lorsqu’on dépouille, on interroge tout le monde ?). Or me direz vous, 1013 personnes ce n’est pas beaucoup. Et une marge d’erreur importante, cela peut être un vrai problème. Supposons que Ségolène Royal ait un score de 24% et Bayrou de 20% à plus ou moins 5%. On ne peut pas savoir, même s’il s’agissait d’un sondage sorti des urnes, qui passe au second tour. De ce fait les sondeurs essayent d’avoir une marge d’erreur faible, proche de 1 à 2%.

 

Pour réduire la marge d’erreur en interrogeant peu de personnes, les sondeurs utilisent la « méthode des quotas » (cela coûte cher d’interroger beaucoup de monde). Cette méthode consiste à prendre une représentation du corps électoral et à interroger un échantillon correspondant à cette représentation. Par exemple on sait que les femmes votent plus que les hommes, disons que la répartition est de 55% de femmes et de 45% d’hommes dans les votants. Il faut aussi que l’échantillon comporte 55% de femmes et 45% d’hommes. De même pour le poids des différentes classes d’âge, pour la plus grande participation des plus diplômés… Cela permet –pour des raisons que je n’expliquerais pas ici- d’interroger peu de personnes tout en gardant des résultats un peu près fiables.

 

Première remarque à ce sujet : Que se passe-t-il si des individus qui n’avaient pas l’habitude de voter (les jeunes de banlieue, les Français de l’étranger…) se mettent à se rendre aux urnes ? Comment les sondeurs prennent-ils en compte cet effet ? Là encore la question reste ouverte.

 

Deuxièmement cette méthode explique aussi pourquoi il ne faut pas donner crédit au site Internet de type « votez2007.com », sur lesquels les internautes se connectent puis votent. Pensez-vous vraiment que l’individu moyen qui fait la démarche d’aller voter en ligne correspond au votant moyen du dimanche ? Il a un niveau de diplôme et de revenu plus élevé, est plus souvent un homme… Le moins que l’on puisse dire c’est que l’échantillon est biaisé ! Les résultats de ces « pseudo sondages » ne reflètent que les résultats d’une élection à laquelle seuls les visiteurs de ce site prendraient part.

 

En réalité la méthode idéale consisterait à choisir parfaitement au hasard des individus dans la population française, à les interroger (et à les forcer à répondre) puis à corriger les résultats à l’aide de la méthode des quotas. Or aucun institut de statistiques privé ne peut faire ça (seul l’INSEE peut). Dans les faits ces instituts privés interrogent les gens par téléphone, donc n’interrogent que les gens possédant un téléphone et étant présent à leur domicile au moment de l’appel. Cela peut paraître anodin, mais cela écarte les étudiants qui ne vivent pas chez leurs parents (ils ont un portable pas de fixe), les gens qui travaillent pendant la soirée quand les coups de fil sont passés…

 

Pour conclure ce très long post, je dirais qu’avant de critiquer un sondage, il faut connaître les circonstances exactes de sa réalisation, car un sondage bien fait peut être tout à fait informatif. Si un candidat est crédité de 1% des intentions de vote, malgré toutes les limites évoquées dans ce post, il est peu probable qu’il fasse 30%.

 

Une fois de plus on doit se souvenir que les résultats qu’on nous donne à la télévision à 20h01 le soir des élections sont faits à l’aide de ces méthodes statistiques si souvent décriées. Or ces sondages à la sortie des urnes se trompent rarement. Au pire des cas les sondeurs déclarent « on ne peut savoir à l’aide des données actuelles, il faut attendre le dépouillement complet des bulletins » (comme lors des élections américaines Bush/Al Gore).

 

Voilà j’espère que j’aurai un peu éclairé les lecteurs qui m’ont lu jusqu’au bout. N’hésitez pas à me poser des questions !


 

 

[1] J’explique un peu les techniques de ces techniques de redressement dans ma deuxième et troisième question

Publié dans Questions de société

Pour être informé des derniers articles, inscrivez vous :

Commenter cet article

Nereis 11/03/2007 21:48

Les sondages ne peuvent rendre compte que de l\\\'impact des médias sur l\\\'état de l\\\'opinion à un moment donné et ne peuvent pas donner une image réaliste de l\\\'évolution politique réelle de la société qui conduit au résultat réel dans les urnes, parce que leurs échantillons sont construits sur la base d\\\'une population "écoutant-regardant-lisant" les médias et non sur celle de la population qui se rend aux meetings, qui discute, lit et analyse les programmes politiques des candidats, qui forme petit à petit son opinion d\\\'électeur : population plus difficile à cerner par les méthodes statistiques avant le jour J de l\\\'élection et pourtant qui joue un rôle déterminant dans les résultats finals lorsque son poids (au sens statistique) est important par rapport à la population ne faisant que "gober" la semoule pré-digérée des médias. Voilà pourquoi les sondages, surtout très antérieurs au jour J, peuvent se tromper gravement sur le résultat final. En bref, ils ne prennent pas en compte (ou seulement de façon très décalée) l\\\'évolution de la conscience des électeurs sous l\\\'impact du travail militant, des meetings, etc.
Nereis
 

Val 08/03/2007 23:46

Oui bien sûr que les gens sont capables de se faire une opinion eux-mêmes, mais par exemple, beaucoup de gens vont voter Bayrou depuis qu'ils voient qu'il a une chance de passer. Sa progression est de plus en plus rapide, c'est un peu un effet boule de neige. C'était un peu comme Ségolène, certains se disaient qu'elle était la seule à pouvoir gagner donc ça faisait encore plus de gens à le penser, donc ça incitait encore d'autres à voter pareil. Bon il est tard, c'est aps forcément très clair ce que j'ai dit, mais je pense que vous comprenez ce que je veux dire.

Patricia 08/03/2007 15:01

Pour répondre aux questions qui m'ont été posées.
 

1- Les sondages sortie des urnes utilisent la technique des quotas. Ils sont plus fiables dans la mesure où l'on élimine le facteur "changement d'avis", mais bien sûr comme pour  les prévisions de vote, les gens mentent. Cet effet est corrigé par les sondeurs (comme je l'ai expliqué dans mon post), mais du coup il y a une marge d'incertitude qui demeure.  Quand les résultat sont trop proches, les sondeurs ne peuvent faire de prévisions avant le dépouillement (cf. Al Gore/Bush). Les résultats sont plus fiables également car ils sont faits sur des échantillons plus larges. Un sondage sortie des urnes n'est jamais fait (enfin j'espère) sur 800 personnes.
 

2- Pour la marge d'erreur qui découle de la méthode des quotas, il me semble de mémoire qu'on ne peut pas la calculer. Elle est inférieure à la marge d'erreur qu'on aurait en prenant aléatoirement des individus sans redresser à l'aide des quotas. Cette dernière se calcule, donc on peut avoir une approximation il me semble. Je ne suis pas tout à fait sûre de ce dernier point, je vais vérifier et je vous complète ma réponse sous peu.
 

Pour conclure je dirais que de nombreux sondages sont "bâclés" c'est à dire fait sur des échantillons trop faibles, sans qu'on prévienne le public de ces limites et c'est cela qui nuit tellement à cette discipline.
 

Les sondages des années 1960 étaient peut être fait de manière artisanal, mais sans doute sur un plus grand échantillon. Peut être cela peut expliquer leur fiabilité.
 

Quant à l'aspect auto réalisateur des sondages, je crois assez en l'intelligence des citoyens pour être capable de se faire une opinion, mais c'est un point de vue personnel.
 

 
 

Reveur75 08/03/2007 14:55

Je suis assez d'accord avec Marc: ils sont assez fiables en termes de tendance!
Anisi, En 2002, Le Pen montait les derniéres semaines alors que Jospin descendait!

Val 07/03/2007 09:17

Oui c'est un peu ce que je voulais dire dans mon commentaire. On a tellement de sondages rapprochés que les dynamiques sont dures à inverser, même lorsqu'un candidat fait une bonne prestation.