De 2017 à 2019, un bouleversement de la carte électorale ?

de **Azertyuiop** » Jeu 6 Juin 2019 21:46

Etienne92 a écrit:J'y ai vu un vote très anti-système, que j'ai assimilé à tort à un vote blanc.

Dans ce cas, il faudrait aussi en déduire que les votes RN, DLF et LO sont aussi semblables à des votes blancs.

Etienne92 a écrit:Merci en tous cas pour les chiffres. Cependant je suis un peu surpris de voir les colonnes Exp'imés et Blancs/Nuls avec des chiffres exactement opposés. N'y a-t-il pas une erreur ?

Blanc/Nul, c'est la corrélation avec le pourcentage de votants qui a mis un bulletin blanc ou nul dans l'urne. Exprimés, c'est la corrélation avec le pourcentage de votants qui a exprimé un vote, soit qui n'a pas voté blanc ou nul. Donc, le pourcentage de suffrages exprimés, c'est tout simplement 100%-le pourcentage de blancs et nuls. On en déduit l'un immédiatement dès qu'on a l'autre donc il est tout à fait normal et rassurant que les corrélations agissent en miroir.

Je laisse ici le fichier Excel final sur les cantons pour que ceux qui sont intéressés puissent comprendre comment sont calculées les corrélations

Alambic a écrit: Pour ceux que ça intéresse, c'est possible de faire ça de manière assez aisée à partir des données de l'INSEE disponible ici (https://www.insee.fr/fr/information/2028028) et en particulier la table de passage annuelle. Je peux d’ailleurs transmettre le fichier consolidé au besoin.

J'avoue que je ne comprends pas comment ce fichier de passage fonctionne. J'ai l'impression qu'il me manque une colonne sur la première feuille.

Sinon, il n'y a pas aussi des coefficients de qualité de représentation en analyse en composantes principales ?

de **Alambic** » Jeu 6 Juin 2019 22:42

Azertyuiop a écrit:J'avoue que je ne comprends pas comment ce fichier de passage fonctionne. J'ai l'impression qu'il me manque une colonne sur la première feuille.

Chaque année correspond à deux colonnes (un pour le code géographique INSEE, un pour le nom de la colonne). Mettons qu'il y ait 3 années : t, t+1 et t+2. Si une commune A n'a jamais été fusionnée ou fait l'objet d'une scission, il y a aura une seule ligne pour cette commune : A dans la colonne t+2, A dans la colonne t+1, A dans la colonne t. Si deux communes A et B existaient en année 1 et ont été fusionné en année 2 en une commune C, on aura deux lignes pour ces communes : pour la commune A, C en année t+2, C en année t+1 et A en année t ; pour la commune B, C en année t+2, C en année t+1 et B en année t. Ainsi, si on a des élections en années t et t+2, on peut se servir pour fusionner les résultats en année t pour créer une commune artificielle C cette année là (alors qu'elle n'existait pas encore). Enfin, il y a le cas des communes ayant fait l'objet d'une scission : si une commune A est séparée d'une commune B en année t+1, on aura deux lignes : pour la commune A, A en année t+2, A en année t+1 et A en année t ; pour la commune B, B en année t+2, B en année t+1 et vide en année t. Pour savoir de quelle commune la commune B a été séparée, il faut se reporter à l'onglet "Liste scissions" qui liste de manière exhaustive les scissions (20 sur 10 ans). J'espère que c'est utile.

Azertyuiop a écrit:Sinon, il n'y a pas aussi des coefficients de qualité de représentation en analyse en composantes principales ?

Oui. C'est ce que j'ai appelé "coefficient de sensibilité aux facteurs" dans les colonnes Factor1 à Factor4 du tableau. J'ai toujours fait ce travail en anglais, je suis habitué à utiliser le terme de "factor loading" qui apparemment se traduit en coefficient de qualité de représentation et non comme je l'ai traduit.

de **PhB** » Ven 7 Juin 2019 18:28

@ Alambic

Merci et bravo pour ce magnifique travail.

Je suis peu familiarisé avec l'ACP, même si on m'en a déjà expliqué le principe il y a quelques lustres, et j'aurai des questions de Béotien :
* Je n'ai pas bien saisi la subtilité de prendre l'abstention comme catégorie de référence. Quelle incidence ce choix peut-il avoir sur les facteurs de corrélation, notamment si l'abstention change, d'un scrutin à l'autre, ou d'une commune à l'autre ?
* Par ailleurs j'avais en tête qu'un facteur de corrélation négatif marquait plutôt une anti-corrélation (ou corrélation inversée) tandis qu'un facteur proche de 0 marquait une absence de corrélation. Est-ce bien le cas ici ? Comment est-ce traduit dans les cartes ?

Par ailleurs je suis intrigué par la Corse, qui est toujours en rouge. Y aurait-il un axe "Corse" pour expliquer ce phénomène ? Quels autres électorats y seraient corrélés ?

Je me demande aussi si intégrer d'autres élections intermédiaires (régionales, européennes) ne serait pas intéressant. Mais bon c'est du boulot !

de **Azertyuiop** » Ven 7 Juin 2019 23:02

Alambic a écrit:Oui. C'est ce que j'ai appelé "coefficient de sensibilité aux facteurs" dans les colonnes Factor1 à Factor4 du tableau. J'ai toujours fait ce travail en anglais, je suis habitué à utiliser le terme de "factor loading" qui apparemment se traduit en coefficient de qualité de représentation et non comme je l'ai traduit.

Ok, mais dans ce cas, ce sont les coefficients de contribution des individus à chaque axe qui manquent.

PhB a écrit:* Je n'ai pas bien saisi la subtilité de prendre l'abstention comme catégorie de référence. Quelle incidence ce choix peut-il avoir sur les facteurs de corrélation, notamment si l'abstention change, d'un scrutin à l'autre, ou d'une commune à l'autre ?

Il est obligatoire de prendre une catégorie de référence qui sert de référentiel pour toutes les autres. C'est un peu comme lorsqu'on mesure une vitesse : elle ne veut rien dire dans l'absolu mais doit être regardée relativement à un référentiel fixée.

Par contre, pour moi, c'est une erreur de considérer les pourcentages des inscrits car c'est justement cela qui crée le biais en donnant des scores plus faibles à tous les candidats des zones à forte abstention et en les coloriant à chaque fois plus en rouge qu'elles ne le devraient être. Bon, après, il y a peut-être une subtilité qui m'a échappé.

PhB a écrit:Par ailleurs je suis intrigué par la Corse, qui est toujours en rouge. Y aurait-il un axe "Corse" pour expliquer ce phénomène ? Quels autres électorats y seraient corrélés ?

Il me semble que les axes n'expliquent que les candidats, pas les régions qui ne sont que le reflet des comportements des candidats. Après, il est plutôt logique quand on voit les axes que la Corse qui n'est ni une terre de gauche, ni une terre FN canl historique, ni une terre particulièrement libérale (par contre, je n'aurais pas parié très gros qu'elle soit si peu "populaire-populiste" mais pourquoi pas) soit toujours en rouge.

PhB a écrit:Je me demande aussi si intégrer d'autres élections intermédiaires (régionales, européennes) ne serait pas intéressant. Mais bon c'est du boulot !

Ça aurait été compliqué car les autres élections intermédiaires n'étaient pas à échelon nationale donc il faudrait prendre en compte le fait que l'offre politique n'aurait pas été exactement la même partout. IL y avait 8 circonscriptions pour les élections européennes plus anciennes, et pour les régionales, idem.

D'ailleurs, en parlant de régionales, bon, ce n'est pas vraiment le fil de discussion idéal pour l'évoquer mais je ne vois pas où : je viens d'être interrogé par Ipsos sur le premier tour des régionales de 2021, avec seulement six listes testées : LR, LREM, RN, EELV, FI et une union PS/PCF/PRG, sans têtes de liste spécifiées. Et ensuite, une seconde hypothèse où les têtes de liste étaient données avec Rachid Temal pour le PS, Stanislas Guérini pour LREM, David Cormand pour EELV, Clémentine Autain pour la FI, Geoffroy Didier pour LR et ..... Nicolas Dupont-Aignan pour le RN ! Avec ici une septième liste dite "d'union régionale" conduite par la présidente sortante, Valérie Pécresse. Curieux sondage en tout cas.

de **pop03** » Ven 7 Juin 2019 23:42

Azertyuiop a écrit:
D'ailleurs, en parlant de régionales, bon, ce n'est pas vraiment le fil de discussion idéal pour l'évoquer mais je ne vois pas où : je viens d'être interrogé par Ipsos sur le premier tour des régionales de 2021, avec seulement six listes testées : LR, LREM, RN, EELV, FI et une union PS/PCF/PRG, sans têtes de liste spécifiées. Et ensuite, une seconde hypothèse où les têtes de liste étaient données avec Rachid Temal pour le PS, Stanislas Guérini pour LREM, David Cormand pour EELV, Clémentine Autain pour la FI, Geoffroy Didier pour LR et ..... Nicolas Dupont-Aignan pour le RN ! Avec ici une septième liste dite "d'union régionale" conduite par la présidente sortante, Valérie Pécresse. Curieux sondage en tout cas.

C'était un sondage avec des propositions différentes en fonction de la région du sondé? Ou uniquement porté sur l'IDF?
Ce n'est pas souvent évoqué, mais les régionales de 2021 peuvent avoir une incidence majeure sur l'élection présidentielle de 2022 se déroulant seulement 3 mois avant. Je me demande si ce ne seront pas les élections les plus proches d'une présidentielle de la Ve République.

de **PhB** » Sam 8 Juin 2019 05:36

Azertyuiop a écrit:.

PhB a écrit:* Je n'ai pas bien saisi la subtilité de prendre l'abstention comme catégorie de référence. Quelle incidence ce choix peut-il avoir sur les facteurs de corrélation, notamment si l'abstention change, d'un scrutin à l'autre, ou d'une commune à l'autre ?

Il est obligatoire de prendre une catégorie de référence qui sert de référentiel pour toutes les autres. C'est un peu comme lorsqu'on mesure une vitesse : elle ne veut rien dire dans l'absolu mais doit être regardée relativement à un référentiel fixée.

Par contre, pour moi, c'est une erreur de considérer les pourcentages des inscrits car c'est justement cela qui crée le biais en donnant des scores plus faibles à tous les candidats des zones à forte abstention et en les coloriant à chaque fois plus en rouge qu'elles ne le devraient être. Bon, après, il y a peut-être une subtilité qui m'a échappé.

Oui, il faut une référence, mais pourquoi l'abstention plutôt que la participation, par exemple ? Après tout le nombre de votes est corrélé négativement à l'abstention et positivement à la participation (par définition )
Du coup comment ce choix se traduit-il dans la comparaison entre villes (ou scrutins) dont le taux de participation est très différent ? Est-ce que ça compense ou ça amplifie le biais du choix des inscrits comme critère de mesure des votes ?

de **Azertyuiop** » Dim 9 Juin 2019 17:03

pop03 a écrit:C'était un sondage avec des propositions différentes en fonction de la région du sondé? Ou uniquement porté sur l'IDF?

Ça, je n'en sais rien. Ils m'ont posé les questions classiques dont celle du lieu de résidence ce qui leur a permis de savoir que je vivais en IdF. Après, je ne sais pas ce qu'il se passe pour ceux ayant indiqué une autre région : arrêt du questionnaire ou sondage propre à leur région.

pop03 a écrit:Ce n'est pas souvent évoqué, mais les régionales de 2021 peuvent avoir une incidence majeure sur l'élection présidentielle de 2022 se déroulant seulement 3 mois avant. Je me demande si ce ne seront pas les élections les plus proches d'une présidentielle de la Ve République.

Un an avant. Voire même 13 mois. Les régionales de 2021 se dérouleront en mars même si ça peut éventuellement être amené à bouger (les reports incessants avaient d'ailleurs valeur de sketch lors du précédent quinquennat...). Ce qui ne serait alors pas si près d'une présidentielle que cela au regard de l'historique : les cantonales de 2011, les municipales de 2001 ou les législatives de 1973 ayant eu lieu à une durées similaire de la présidentielle ayant suivi.

Pour les élections proches d'une présidentielle mais suivant celle-ci, c'est encore pire : toutes les législatives sont concernées avec seulement un mois de distance. Il y avait aussi les municipales en 1995.

PhB a écrit:Oui, il faut une référence, mais pourquoi l'abstention plutôt que la participation, par exemple ? Après tout le nombre de votes est corrélé négativement à l'abstention et positivement à la participation (par définition )
Du coup comment ce choix se traduit-il dans la comparaison entre villes (ou scrutins) dont le taux de participation est très différent ? Est-ce que ça compense ou ça amplifie le biais du choix des inscrits comme critère de mesure des votes ?

J'aurais tendance à dire que ça amplifie le biais. Mais comme je vous l'ai dit, je n'ai pas compris le choix qui a été fait par Alambic de retenir le pourcentage des inscrits, et non celui des exprimés.

Pour la référence, après réflexion, il n'y a normalement même pas besoin de choisir une catégorie de référence lors d'une ACP, donc je pose moi-même la question de la signification de choisir l'abstention comme catégorie de référence.

Sinon, à titre indicatif, choisir la participation comme catégorie de référence reviendrait à dire que toutes les catégories sauf l'abstention sont la référence, puisque tout type de vote (blanc et nul compris) sont inclus dans la participation.

de **Alambic** » Lun 10 Juin 2019 15:36

Azertyuiop a écrit:Ok, mais dans ce cas, ce sont les coefficients de contribution des individus à chaque axe qui manquent.

Ici les individus sont les communes. Les coefficients de contribution des individus (ce que j’ai appelé les scores) sont représentés sur les cartes via les quantiles de la distribution correspondante. J’ai considéré que c’était plus lisible pour les non-familiers avec la méthode de lire les cartes via un index allant de 0 à 1 plutôt que les scores directement. Donc, pour répondre à votre question, pour connaitre les individus qui contribuent le plus à chaque axe, il suffit de regarder les communes avec des index proche de 0 et proche de 1 car ce sont ceux qui ont les scores respectivement les plus négatifs et positifs alors que les communes ayant des index proches de 0.5 sont neutres sur cet axe. Si vous voulez, je peux fournir directement le fichier avec les scores bruts mais c’est peu lisible quand ça n’est pas cartographié.

PhB a écrit:* Par ailleurs j'avais en tête qu'un facteur de corrélation négatif marquait plutôt une anti-corrélation (ou corrélation inversée) tandis qu'un facteur proche de 0 marquait une absence de corrélation. Est-ce bien le cas ici ? Comment est-ce traduit dans les cartes ?

Vous avez raison en général sur le fait qu’un facteur de corrélation négatif marque une anti-corrélation mais ici, vu le modèle que j’ai utilisé, un coefficient nul va également pouvoir être interprété comme une anti-corrélation par rapport aux comportements des variables qui nous intéresse (le résultat individuel d’un candidat). J’explique ça en détail dans la réponse au message suivant.

Azertyuiop a écrit:
PhB a écrit:* Je n'ai pas bien saisi la subtilité de prendre l'abstention comme catégorie de référence. Quelle incidence ce choix peut-il avoir sur les facteurs de corrélation, notamment si l'abstention change, d'un scrutin à l'autre, ou d'une commune à l'autre ?

Il est obligatoire de prendre une catégorie de référence qui sert de référentiel pour toutes les autres. C'est un peu comme lorsqu'on mesure une vitesse : elle ne veut rien dire dans l'absolu mais doit être regardée relativement à un référentiel fixé.

Par contre, pour moi, c'est une erreur de considérer les pourcentages des inscrits car c'est justement cela qui crée le biais en donnant des scores plus faibles à tous les candidats des zones à forte abstention et en les coloriant à chaque fois plus en rouge qu'elles ne le devraient être. Bon, après, il y a peut-être une subtilité qui m'a échappé.

Je ne souhaitais pas entrer précisément dans les détails de la méthodologie pour ne pas être rébarbatif mais vu vos questions, je me sens obligé.

Je n’ai pas fait directement une ACP sur les % des inscrits mais sur des variables transformées à partir du % des inscrits. Je vais vous expliquer quelle transformation j’ai faite et pourquoi. Je me suis inspiré des modèles de choix statistiques à options multiples. Ces modèles sont utiles quand on a des données pour N individus (associés à des caractéristiques qui leur sont proches) qui doivent faire un choix unique entre K options. Grâce à ces modèles, on peut estimer comment les caractéristiques propres aux individus influencent le choix d’une ou de l’autre des options par rapport à une catégorie de référence. On le fait statistiquement en regardant comment la probabilité de chaque d’une option vs. celle de l’option de référence varie en fonction des caractéristiques. De tels modèles sont très proches de la situation qui nous intéresse ici : on a des électeurs qui doivent choisir entre différentes options dont chacun des candidats, le blanc/nul ou l’abstention. La seule différence est que nous n’observons pas le vote individuel mais une agrégation de ce vote au niveau de la commune. Idéalement, on préférerait descendre au niveau le plus désagrégé disponible (le bureau de vote) mais je ne peux pas le faire à cause des redécoupages de bureaux de vote entre élections (pour avoir des entités géographiques stables). Ici, j’approxime donc la probabilité de choisir une option électorale dans une commune par le % des inscrits qui ont choisi cette option et je modélise ces probabilités selon un modèle de régression logistique multinomiale. (Si vous voulez du détail sur cette méthode, l’article Wikipédia ici est bien fait : https://en.wikipedia.org/wiki/Multinomi ... regression) – en particulier, la partie « As a log-linear model »). En prenant comme catégorie de référence l’abstention, ça revient à s’intéresser aux variables transformées suivantes : [log(résultat candidat i en % des inscrits) - log(résultat abstention en % des inscrits)]. Avec cette modélisation, on étudie comment les ratios entre les voix de chaque candidat et celles de l’abstention varie dans l’espace. L’ACP permet d’identifier des directions de variation de ces ratios communes à l’ensemble (ou un sous-ensemble) de candidats. Il est important à cet égard de prendre comme catégorie de référence une option électorale qui est disponible (et identique) pour les électeurs à l’ensemble des scrutins. Ceci laisse donc deux choix possibles : ou bien l’abstention ou bien l’option blanc/nul. J’ai choisi de retenir l’abstention car c’est une option retenue par beaucoup plus l’électeur et qui est donc moins « bruitée » que la catégorie blanc/nul.

Il faut de plus garder en tête qu’une ACP identifie des directions de variation des variables étudiées relativement à leur valeur moyenne. Ainsi, si certaines élections présentent un % d’abstention systématiquement supérieur à d’autres scrutins, cela n’influencera aucunement les résultats pour autant que la géographie de l’abstention soit similaire entre les scrutins. En revanche, s’il y a certaines communes dans lesquelles l’abstention est systématiquement supérieure à la moyenne nationale de l’abstention, cela sera pris en compte. Néanmoins, tout dépendra du fait de savoir si ces zones où l’abstention est systématiquement supérieure ont des comportements électoraux spécifiques. En effet, s’il existe une géographie de l’abstention qui est indépendante des choix électoraux, l’ACP identifiera uniquement un axe « participation » vis-à-vis duquel l’intégralité des candidats auront une sensibilité positive. Ce n’est clairement pas ce que l’on observe dans mes résultats : au contraire, la carte de l’abstention est essentiellement liée à l’axe 2 mais ce que cet axe indique est ce que ce sont les zones où c’est spécifiquement le score des partis libéraux qui est faible. Cela signifie aussi qu’il y a de l’information relative aux comportements électoraux dans le % d’abstention (par rapport à la moyenne) et qu’on ne doit pas ignorer cela directement. L’autre raison pour laquelle je pense qu’il est justifié de raisonner en % des inscrits est liée au fait que je regarde les résultats des élections en prenant en compte les deux tours. Vu que l’on restreint les options électorales au 2ème tour, les passages des électeurs entre l’abstention et le vote exprimé entre les deux tours sont également informatif des comportements électoraux. Par exemple, si on regarde 2017, il y a eu des transferts vers l’abstention et le vote blanc/nul pour les électeurs Mélenchon ou Fillon.

Je reviens maintenant sur l’interprétation des coefficients. Je vais prendre un exemple simple pour pouvoir illustrer les choses. Imaginons que l’on ait seulement 3 options électorales (candidat A, candidat B, abstention) et qu’après avoir mis en œuvre l’ACP sur les variables transformées (ici, deux variables par conséquent), on obtienne un seul axe pertinent. Sur cet axe, le candidat A a un coefficient de sensibilité de 1 et le candidat B a un coefficient de 0. Cela signifie que lorsque le ratio entre les voix obtenues par le candidat B et l’abstention est invariante sur cet axe (ou que ce ratio est toujours égal à sa moyenne sur l’ensemble des communes) alors que le ratio entre les voix obtenues par le candidat A est l’abstention est croissante avec le score de la commune sur l’axe (inférieur à la moyenne si le score est négatif, supérieur à la moyenne si le score est négatif). Par conséquent, quand le score est négatif cela signifie que le résultat du candidat A en % des inscrits est inférieur à la moyenne mais aussi nécessairement que le score du candidat B et de l’abstention sont supérieurs à la moyenne (ce n’est que le ratio entre ces deux dernières qui est invariante). C’est la raison pour laquelle j’ai interprété un coefficient de 0 également comme une anti-corrélation alors qu’habituellement cet effet n’existe pas.

Idéalement, pour exprimer plus clairement les résultats sur chaque axe, il aurait fallu, pour chaque axe, que je calcule l’effet sur les résultats de passer de la moyenne (i.e. une « commune » située à un score de 0.5 sur tous les axes) à un index de 0.25 et 0.75 uniquement sur cet axe-là. Ça donnerait une meilleure idée de la transformation des résultats le long d’un axe.

Je mentionne également qu’avec la modélisation retenue, l’effet des différents axes interagissent. En effet, dans une zone à la fois de « populaire populiste » et de droite, le score du RN sera doublement plus élevé par rapport à sa moyenne (avec un score d’Hamon doublement moins élevé par exemple). C’est une bonne propriété car on sait que cela correspond à certains effets. Dans le bouquin de Fourquet paru récemment (L’Archipel Français), il documentait par exemple que le vote des ouvriers pour le RN était systématiquement supérieur au vote des cadres pour le RN et simultanément que le vote de chacune de ces deux catégories pour le RN est croissant avec le sentiment de déclin / faible dynamisme économique de sa zone d’emploi.

Je finis en mentionnant que les cartes que je produis ne paraissent globalement pas des artefacts. En effet, l’axe 1 correspond à peu près à un gradient d’éloignement par rapport aux zones dynamiques économiquement alors que l’axe 2 est très proche de la carte du revenu médian. Sur ce dernier point, vous pouvoir regarder cet outil de visualisation qui est assez éloquent : http://map.datafrance.info/population (rubrique population / revenus).

Azertyuiop a écrit:
PhB a écrit:Par ailleurs je suis intrigué par la Corse, qui est toujours en rouge. Y aurait-il un axe "Corse" pour expliquer ce phénomène ? Quels autres électorats y seraient corrélés ?

Il me semble que les axes n'expliquent que les candidats, pas les régions qui ne sont que le reflet des comportements des candidats. Après, il est plutôt logique quand on voit les axes que la Corse qui n'est ni une terre de gauche, ni une terre FN canl historique, ni une terre particulièrement libérale (par contre, je n'aurais pas parié très gros qu'elle soit si peu "populaire-populiste" mais pourquoi pas) soit toujours en rouge.

Je suis d’accord avec cette interprétation. Pour prendre l’exemple de 2017, MLP et Fillon ont fait de gros scores en % des exprimés mais ils sont beaucoup plus proche de la moyenne nationale quand on regarde en % des inscrits (MLP : 18.4% des inscrits en Corse vs. 16.1% en France // FF : 16.9% en Corse vs. 15.1% en France). Par ailleurs, les autres principaux candidats ont fait des scores très sensiblement inférieurs à leur moyenne nationale en Corse, en % des exprimés mais aussi en % des inscrits (EM : 12.2% en Corse vs. 18.2% en France // JLM : 9.1% en Corse vs. 14.8% en France). C’est cohérent avec un rejet de la gauche et des partis libéraux. Le score de MLP peut paraitre étonnant au regard du résultat sur l’axe « populaire-populiste » mais il ne faut pas oublier que le RN a aussi une sensibilité à l’axe droite-gauche non négligeable. Ce que ça semble indiquer est que le vote RN en Corse est un vote d’extrême droite « classique ».

Azertyuiop a écrit:
PhB a écrit:Je me demande aussi si intégrer d'autres élections intermédiaires (régionales, européennes) ne serait pas intéressant. Mais bon c'est du boulot !

Ça aurait été compliqué car les autres élections intermédiaires n'étaient pas à échelon nationale donc il faudrait prendre en compte le fait que l'offre politique n'aurait pas été exactement la même partout. IL y avait 8 circonscriptions pour les élections européennes plus anciennes, et pour les régionales, idem.

En effet, il me faut nécessairement arriver à avoir des résultats électoraux à l’échelle nationale pour pouvoir l’inclure dans la procédure d’estimation. En effet, l’ACP fonctionne en regardant les écarts à la moyenne sur l’ensemble des communes. Il y a deux manières de contourner ce problème. La première option consiste à consolider les résultats des élections par circonscription au niveau national en se servant des étiquettes. Cela peut poser problème quand les alliances ne sont pas identiques entre les circonscriptions (par exemple aux régionales). Par ailleurs, même si on n’a pas ce problème-là, on estimera via l’ACP un positionnement moyen au niveau national de l’ensemble des listes regroupées sous la même étiquette : si, dans la réalité, des électeurs ont perçu ces listes comme différemment positionnées, cela générera des écarts qui seront corrigés dans des axes secondaires – il faudrait donc interpréter les résultats à la lumière des axes principaux et de ces axes correctifs. L’autre seconde option serait de ne pas utiliser les résultats des élections intermédiaires pour estimer les axes via l’ACP mais de se servir des axes estimés via une ACP sur les scrutins nationaux puis de régresser les résultats des élections intermédiaires directement sur ces axes estimés. De cette manière, on peut obtenir une analyse du positionnement de chaque liste par circonscription qui est indépendante l’une de l’autre. Mais c’est effectivement un peu de boulot.

de **Alambic** » Jeu 5 Sep 2019 10:19

Je signale la publication d'un livre de Yann Algan, Elizabeth Beasley, Daniel Cohen et Martial Foucault intitulé "Les origines du populisme" : http://www.seuil.com/ouvrage/les-origin ... 2021428582

J'ai fini sa lecture (c'est l'affaire d'une poignée d'heures). Sans être nécessairement d'accord avec la thèse, il y a des données intéressantes qui sont exploitées. En particulier, des données de sondages longitudinaux du CEVIPOF assez fournies qui leur permettent d'analyser les déterminants individuels du vote. Ca mérite de s'y intéresser.

Je prêche un peu pour ma paroisse mais, grâce à des données très différentes (je travaillais sur les votes agrégés localisés, eux sur les votes individuels non localisés), ils identifient deux dimensions qui sont déterminantes dans le vote : l'une qui concerne la satisfaction par rapport à sa propre vie, l'autre qui concerne le degré de confiance interpersonnelle. Ce qui est intéressant, c'est que les liens entre ces deux dimensions et le choix des candidats qu'ils identifient correspondent exactement à celui que j'avais identifié avec mes deux premiers axes. Mon premier axe que j'avais appelé "populaire-populiste" (et qu'à la réflexion, on devrait plutôt appeler "nationaliste") correspond à leur axe relatif au degré de confiance interpersonnelle. Mon second axe que j'avais appelé "libéral-mainstream" correspond à leur axe relatif au bien-être. Encore mieux, ils sont construits des cartes relatifs à ces deux axes et ça correspond également extrêmement bien à la géographie de mes deux premiers axes :

- Carte de la confiance interpersonnelle :

- Carte du bien-être / satisfaction par rapport à sa propre vie :

Si vous ne voulez pas lire le bouquin, il y a déjà pas mal d'éléments de leurs recherches sur le sujet qui sont repris dans cet article (le focus est sur les Gilets Jaunes, mais le propos est en réalité plus général) : https://www.cepremap.fr/2019/02/note-de ... -soutiens/

La chose importante qu'il leur manque, me semble-t-il, est l'axe droite-gauche que j'avais identifié et qui se sur-ajoute à ces deux dimensions communes.

De 2017 à 2019, un bouleversement de la carte électorale ?

Re: De 2017 à 2019, un bouleversement de la carte électorale ?

Re: De 2017 à 2019, un bouleversement de la carte électorale ?

Re: De 2017 à 2019, un bouleversement de la carte électorale ?

Re: De 2017 à 2019, un bouleversement de la carte électorale ?

Re: De 2017 à 2019, un bouleversement de la carte électorale ?

Re: De 2017 à 2019, un bouleversement de la carte électorale ?

Re: De 2017 à 2019, un bouleversement de la carte électorale ?

Re: De 2017 à 2019, un bouleversement de la carte électorale ?

Re: De 2017 à 2019, un bouleversement de la carte électorale ?

Qui est en ligne