Un peu de datamining amusant.

Prenez deux sources de données bien différentes, comme par exemple, d'un côté, le site du CSA qui fait le décompte des temps de parole accordés aux candidats avant que la liste définitive ne soit connue (ici en pdf), et de l'autre, les données du ministère de l'intérieur concernant les suffrages exprimés au 1er tour.

A priori, ces données n'ont rien à voir, elles mesurent des choses différentes, à un moment différent, avec des méthodes de comptage qui n'ont rien à voir, et dont l'origine n'est pas contestable ou orientée.
Mettez-les quand même dans un seul tableau Excel ou LibreOffice, et calculez les temps de passage totaux de chaque candidat dans les émissions d'informations des chaines généralistes.

tempspassage.png

Maintenant, faites un graphique avec ce tableau, en prenant soin de mettre chaque colonne sur un axe Y différent, pour que les échelles soit adaptées :

graphiquetemps.png

Etonnant non ? La proportion des passages télé dans les chaines généralistes est sensiblement la même que la proportion des suffrages pour chaque candidat.
On note toutefois la "diabolisation" du FN qui fait sous-inviter Lepen par rapport à ses résultats réels, et le résultat étonnant de 2007 qui fait sur-inviter Bayrou. Le reste de la courbe est quasiment superposée, ce qui fait dire à Libre Office, avec la fonction CORRELATION() que les deux séries de chiffres sont corrélées à un coef 0.98 !!

Il y a plusieurs façons de lire cela.
Soit l'on considère qu'il est normal que la télévision invite davantage les candidats ayant le plus de chances et délaisse les petits candidats qui n'intéressent personne, mais on peut se demander quand même comment les chaînes arrivent à un tel niveau de précision dans la prédiction, meilleur que les sondages. Bien sûr, le CSA demande à ce que, même en dehors des périodes de campagne où le temps de parole doit être équitable, les ratios représentatifs des différents partis soient respectés, en fonction des élus déjà en poste et des précédentes élections. Les équilibres politiques ne changeant pas du tout au tout d'une élection à l'autre, il est à peu près normal de trouver une ressemblance entre les deux courbes. Mais une corrélation à 0.98 ?

Soit l'on considère, mais il faudrait avoir l'esprit drôlement mal tourné, que le nombre de passages télé influence plus ou moins directement le vote des français, un peu comme la publicité influence nos achats, même de façon inconsciente.
On pourrait même se laisser à croire que les dépenses pharaoniques de campagne qui suivent elles aussi assez précisément les résultats des candidats font de notre démocratie un exercice de pure forme, un simulacre, un théâtre.

Je vous laisse vous faire votre propre opinion.

Commentaires

1. Le mardi, 22 janvier 2013, 21:59 par David

Bonjour Mérome,

Dans le même ordre d'idée (mais peut-être que cela venait de toi, je ne me souvient plus), il y a un analyste linguistique qui s'est livré à un travail intéressant sur les campagnes (parties et présidentielles) depuis 2007 et observe que l’occurrence des noms des candidats sur les médias internet coïncide très étonnamment avec les résultats des élections, voire mieux que les sondages eux mêmes!
http://blog.veronis.fr/2012/04/pres...
http://blog.veronis.fr/2011/10/prim...
http://blog.veronis.fr/2007/05/2007...
http://blog.veronis.fr/2007/04/2007...

Le pas que tu esquisses est en effet tentant...

David

2. Le mardi, 22 janvier 2013, 23:28 par Stef

Tu ne donnes pas ton avis alors je ne donne pas le mien.

Mais on est d'accord. :)

3. Le mercredi, 23 janvier 2013, 09:00 par anteCii

Il me semble que le rapport du CSA est sorti en novembre 2012. Et si les données qu'il contient étaient légèrement manipulées pour les faire cadrer avec les votes. Est-ce vraiment absurde d'imaginer que ceci serait possible ? Je n'y crois pas. Mais la concordance quasi parfaite des données me laisse quand même dubitatif...

4. Le mercredi, 23 janvier 2013, 09:05 par Jeff Renault

Pourquoi je ne suis même pas étonné ?

5. Le mercredi, 23 janvier 2013, 09:42 par Merome

@anteCii : les rapports de temps de parole ont été publié par le CSA au fur et à mesure entre janvier et mail 2012. Le rapport de novembre est une synthèse sur la présidentielle. Par ailleurs, il n'y a aucune raison pour que le CSA truque les temps de parole pour les faire coller aux résultats. Dans quel objectif ferait-il ça ?

6. Le mercredi, 23 janvier 2013, 09:58 par Bob

C'est tres proche de ce qui est dit dans Les nouveaux chiens de garde (le film et sans doute le bouquin d'il y a 15 ans, faudrait que je le relise) : si tu veux imposer une idee ou un discours, tu ne fais participer dans les media que les supporters de cette idee. C'est de la propagande de base :)

Rien d'inattendu finalement.

7. Le mercredi, 23 janvier 2013, 10:15 par anteCii

Comme je te l'ai dit, je n'y crois pas.
Mais, pour ce qui est de l'objectif, si on avait voulu favoriser un ou plusieurs candidats, il suffirait de sous-estimer leur temps de parole décompté par rapport à un temps de parole plus important accordé en réalité. Faire cadrer les temps de parole avec les votes permettrait de les légitimer.

8. Le jeudi, 24 janvier 2013, 10:24 par Krka

Je suis dubitatif.
Ce 0,98 est trop gros.

Alors forcément ca m'interpelle.

Je vais examiner ca à l'occasion. Ce ne serait pas venu de toi, j'aurai cru à une manip.

9. Le jeudi, 24 janvier 2013, 11:11 par Merome

@Krka : je t'invite à prendre les chiffres toi-même à la source et à faire le tableau sur excel, c'est ce que j'ai fait parce que je n'y croyais pas, moi non plus.

10. Le vendredi, 25 janvier 2013, 21:37 par viconte

Intéressant. Merci pour cette démo

11. Le samedi, 26 janvier 2013, 00:04 par Stef

Merome, je me suis permis d'utiliser ton graphique sur facebook, je ne pense pas que ça te pose problème mais sinon dis le moi.

12. Le samedi, 26 janvier 2013, 11:37 par Merome

@Stef : Je propose que tu me défraies du manque à gagner. Tu me dois la moitié du chiffre d'affaire de facebook.

13. Le samedi, 26 janvier 2013, 13:58 par Stef

Si je te paye en actions Facebook ça ne devrait pas me couter trop cher... :)

14. Le mardi, 26 février 2013, 14:22 par Z

En même temps, le décompte du temps de parole du CSA ne permet pas de prédire le vainqueur de l'élection.
Donc dire que c'est meilleur que les sondages, faut voir... !

15. Le vendredi, 5 avril 2013, 13:57 par Christophe Vieren

N'aurais-tu la possibilité de faire un hyper lien sur les images pour un zoom ?

16. Le vendredi, 5 avril 2013, 17:04 par Merome

Tu peux prendre le fichier LibreOffice et refaire le calcul, ou alors vérifier ça chez d'autres qui ont fait la même chose en mieux (plus gros surtout)

Ajouter un commentaire

Les commentaires peuvent être formatés en utilisant une syntaxe wiki simplifiée.

La discussion continue ailleurs

URL de rétrolien : https://merome.net/blog/index.php?trackback/923