Bonjour,
J'apporte ma contribution à cette discussion.
J'ai récupéré sur le site data.gouv.fr l'ensemble des résultats des scrutins nationaux au niveau communal (ou d'arrondissement municipal pour Paris, Lyon et Marseille) pour la France métropolitaine entre 2002 et 2019. Les scrutins retenus sont donc 4 présidentielles (2002, 2007, 2012, 2017), une européenne (2019) et un référendum (2005). J'ai regroupé ces résultats de manière à avoir des unités géographiques stables dans le temps (en regroupant des communes nouvellement fusionnées comme si elles avaient toujours été fusionnées ainsi que les communes ayant fait l'objet d'une scission comme si ces séparations n’avaient jamais eu lieu). Pour ceux que ça intéresse, c'est possible de faire ça de manière assez aisée à partir des données de l'INSEE disponible ici (
https://www.insee.fr/fr/information/2028028) et en particulier la table de passage annuelle. Je peux d’ailleurs transmettre le fichier consolidé au besoin.
J'ai ensuite réalisé une analyse en composantes principales (ACP) de ces données en me basant sur les résultats en % des inscrits, en pondérant chaque commune par son nombre d'inscrits. Le choix de retenir une analyse à partir des résultats en % des inscrits permet de ne pas introduire de biais s'il existe de l'abstention différentielle entre les scrutins non uniforme géographiquement. Par ailleurs, comme il existe un nombre fini d’options pour chaque scrutin (un candidat, blanc/nul, abstention), j’ai pris comme catégorie de référence celle de l’abstention : l’analyse porte donc sur le choix d’une autre option versus le choix de s’abstenir.
Pour ceux qui ne seraient pas familiers avec cette méthode, l'ACP permet ici d'identifier une géographie électorale et un positionnement des candidats par rapport à cette géographique électorale. En particulier, on va obtenir un certain nombre d'axes permettant de "résumer" le score des candidats : chaque commune aura un score pour chacun de ces axes et chaque candidat aura un unique coefficient de sensibilité pour chacun des axes. Ici, puisque j'étudie plusieurs scrutins simultanément la géographique identifiée est stable dans le temps.
Je présente ci-dessous un tableau avec les coefficients de sensibilité par rapport aux axes ainsi que des cartes de France pour chacun des axes. Pour plus de lisibilité, je n'ai pas indiqué sur les cartes les scores par rapport aux axes directement mais le quantile correspondant au score : la commune la plus marquée négativement sur un axe aura donc un score de 0, une commune dans la médiane française aura un score de 0.5 et la commune la plus marquée positivement sur un axe aura un score de 1.
Passons maintenant aux résultats. Je mets dans ce post des liens qui permettent de télécharger des fichiers image assez légers mais peu détaillés et des PDFs beaucoup plus lourds mais beaucoup plus détaillés (ils permettent de zoomer en particulier sur les cartes). La durée de vie des liens est d'une semaine. Je n'aurais préféré inclure les fichiers images directement dans le post mais ça a été infructueux (un peu d'aide pourrait être bienvenue si vous pensez que ça serait plus lisible).
J’ai identifié 4 axes principaux, communs à l’ensemble des élections. Ces axes représentent conjointement 76% de la variance. On peut aller regarder dans des axes mineurs (ça peut avoir un intérêt) mais ils ne sont plus nécessairement communs à l’ensemble des élections – ils peuvent expliquer par exemple une abstention différentielle à un scrutin par rapport à un autre. J’y reviendrai à la fin.
Je vais donner des noms à ces axes qui sont clairement imparfaits (et probablement pas les plus pertinents) mais qui vont faciliter l’exposé par commodité de langage. Pour interpréter ces axes, il convient de regarder le tableau des coefficients de sensibilité des candidats. Lorsqu’un candidat a un coefficient proche de 1 sur un axe, ça veut dire qu’il est positivement très sensible à cet axe : si une commune a un score élevé sur cet axe, le candidat aura un résultat élevé sur cette commune ; si une commune a un score faible sur cet axe, le candidat aura un résultat faible dans cette commune. A l’inverse, si un candidat a un coefficient proche de 0 ou négatif sur un axe, son résultat sera élevé dans les communes avec un score faible sur l’axe et faible dans les communes avec un score élevé sur l’axe. Voici le tableau des coefficients de sensibilité (chaque ligne correspond à une option pour une élection, les colonnes Factor1 à Factor4 correspondent au coefficient de sensibilité d’une option par rapport à chaque axe et la colonne « Uniqueness » correspond à la fraction de la variance du résultat de l’option électorale non expliquée par les 4 axes) :
Lien image :
https://we.tl/t-mXp1QEIGiJLien PDF :
https://we.tl/t-IA6tHLrYgSAxe 1 :
Cet axe représente 28% de la variance.
On remarque que, sur l’axe 1, les candidats qui ont des coefficients élevés sont les candidats FN, MNR, Les Patriotes, CPNT, le Non au référendum mais aussi NPA et LO ainsi que certains candidats de droite captant une part d’électorat populaire type Sarkozy, de Villiers ou Dupont-Aignan. A l’inverse, les candidats qui ont des coefficients faibles ou négatifs sur cet axe sont les candidats écologistes, le Oui du référendum, Royal, Hamon, Macron/LREM, Bayrou, Fillon/LR. Je nomme donc cet axe « populaire-populiste » (je suis preneur de vos suggestions sur le vocabulaire). Voici la carte de France correspondant à cet axe :
Lien image :
https://we.tl/t-8kezpMN0EsLien PDF :
https://we.tl/t-ex1qYt1VT3On distingue sur cette carte de manière nette une opposition entre les grandes villes et leurs banlieues immédiates (scores faibles sur l’axe) vs. des zones plus éloignées. Par ailleurs, on remarque que certaines zones hors métropolitaines présentent aussi des scores relativement faibles, dans l’Ouest (en particulier en Bretagne), sur les littoraux de manière générale ainsi que les zones montagneuses. Il y a des scores faibles très marqués également dans les stations de sport d’hiver et les zones avec des travailleurs frontaliers. Il est intéressant de constater que certaines zones de force du RN ne se retrouvent pas sur cette carte, en particulier le bassin minier et, de manière générale, les zones d’industrie en déclin (Lorraine, bassin potassique). On n’a également pas des scores très élevés sur la cote méditerranéenne de PACA. Continuons pour voir comment ça peut s’expliquer.
Axe 2 :
Cet axe représente 25% de la variance.
On remarque que, sur l’axe 2, les candidats qui ont des coefficients élevés sont les candidats de centre-droit + les écologistes : Lepage/Joly/EELV, Bayrou/Macron/LREM, Madelin, le Oui au référendum, Sarkozy/Fillon/LR. A l’inverse, les candidats qui ont des coefficients faibles ou négatifs sur cet axe sont les candidats d’extrême gauche, communistes, d’extrême droite, CPNT, le Non de 2005. Les candidats de gauche traditionnelle (Hollande, Royal, Jospin) ont également des scores relativement faibles bien que moins prononcés par rapport à des candidats à gauche. Je nomme donc cet axe « libéral-mainstream ». Voici la carte de France correspondant à cet axe :
Lien image :
https://we.tl/t-C5baynDGa6Lien PDF :
https://we.tl/t-iG07oKBNxmOn distingue sur cette carte des scores élevés dans la partie aisée de la région parisienne (Ouest, autour du bois de Vincennes, Fontainebleau, Chantilly/Senlis), dans certaines zones de l’Ouest (Vendée, Loire-Atlantique, Maine-et-Loire, Mayenne, Golfe du Morbihan, Nord-Finistère, Calvados côtier + banlieue non populaire de Caen, Sud-Manche), sur les contreforts Sud du Massif Central, dans la partie aisée de la région lyonnaise, dans les Savoies, dans le Doubs (hors zone proche de Montbéliard), en Alsace (à l’exception du bassin potassique), autour de Pau, de Toulouse, etc. A l’inverse, les zones avec des scores faibles regroupent un certain nombre de zones avec des difficultés économiques de diverses natures : par exemple, liées au déclin industriel ou agricole (bassin minier, Nord des Ardennes, Calais/Dunkerque/Boulogne-sur-Mer, certaines régions de la Somme, de l’Aisne ou de l’Oise, les régions industrielles de Moselle/Meurthe-et-Moselle, le bassin potassique d’Alsace, est de la Saône-et-Loire, autour de l’Etang de Berre, la région d’Alès, le Sud du Languedoc-Roussillon après Montpellier, Saint-Nazaire, banlieue Sud de Rouen, région du Havre, Montluçon, le long de la vallée de l’Yonne), des banlieues populaires de grandes villes (Seine-Saint-Denis, certaines communes du Val-de-Marne, Vénissieux/Vaulx-en-Velin, Hérouville-Saint-Clair/Colombelles/etc., La Trinité à coté de Nice) Il y a également des zones dont je connais moins la situation économique : les zones montagneuses des Pyrénées, le Médoc, un certain nombre d’endroits dans le massif central (Haute-Vienne, Creuse, Puy-de-Dôme), dans la Nièvre, etc.
On retrouve donc ici certaines zones de force du RN que l’on n’observait pas sur le premier axe. Il est intéressant de constater que sur ces zones là le RN est en concurrence avec la gauche classique et que les partis libéraux-mainstream sont totalement rejetés. On remarque à nouveau qu’à l’exception de la région de l’Etang de Berre, le littoral méditerranéen de PACA n’est pas excessivement marqué par des scores faibles – ce qui accrédite l’analyse qui fait du vote RN dans ces zones un vote différent du vote RN du bassin minier.
Axe 3 :
Cet axe représente 19% de la variance.
Cet axe est facile à dénommer et interpréter. On remarque que, sur l’axe 3, les candidats qui ont des coefficients élevés sont les candidats de gauche ou d’extrême gauche : NPA/LO/PS/PCF/FI. Les candidats Verts/EELV ont des coefficients élevés mais moins marqués que pour les autres candidats de gauche. A l’inverse, les candidats qui ont des coefficients faibles ou négatifs sur cet axe sont les candidats de droite : UMP/LR, UDI, DLF, CNPT, MPF, RN/MNR, Villiers. La situation des candidats centristes est plus fluctuante : le Bayrou de 2002 est à droite, celui de 2007 a un coefficient très nettement plus élevé qui reflue en partie en 2012 ; Macron a un coefficient proche de celui de Bayrou 2007 et il retombe au niveau des candidats de droite classique aux européennes 2019. De manière intéressante (mais pas surprenante), le Non de 2005 a un coefficient relativement élevé sur cet axe. Je nomme donc cet axe « gauche ». Voici la carte de France correspondant à cet axe :
Lien image :
https://we.tl/t-CtI9PJrhKaLien PDF :
https://we.tl/t-pyCq4U8WweLà on retrouve une carte classique. Les zones avec des coefficients élevés sont les zones de gauche : Paris-Est, la banlieue sud de Rouen, la plaine de Caen, la Bretagne à l’exception de la plus grande partie du Morbihan et du Pays de Léon, l’Aunis, la région de Poitiers, la région de Niort, l’Aquitaine (à l’exception de la région de Libourne, du Bassin d’Arcachon et du Pays Basque), la région Midi-Pyrénées (à l’exception de l’est du Tarn et du Nord de l’Aveyron, avec une situation plus contrastée le long de la vallée de la Garonne après Toulouse), la région Limousin (sauf l’Est de la Creuse), la plaine de la Limagne et le bocage Bourbonnais, l’arrière-pays de Languedoc-Roussillon, les Cévennes, le Diois, la région de Besançon, le Nord Jura, autour de Château-Chinon, le pays de Briey. Les zones avec des coefficients faibles sont les zones de droite : les zones frontalières de la Belgique, la baie de Somme, toute la région Champagne-Ardenne, l’Alsace et la Moselle, le Haut-Doubs, la Bresse, le Beaujolais, le Roannais, le pays de Gex, la Haute-Savoie, l’Ouest de l’Isère, le Var, les Alpes Maritimes, le Nord des Bouches du Rhône, le Comtat Venaissin, les contreforts Sud du Massif Central, l’embouchure de la Garonne, la Vendée littorale, un certain nombre de zones dans l’Ouest intérieur (Mayenne sauf Laval, Manche sauf régions de Cherbourg et Granville, Pays d’Auge, Bessin, Perche, Maine et Loire sauf Angers, Nord des Deux-Sèvres), Sologne, Beauce, Gatinais, Puisaye, Brie, Valois, Pays de Bray, Fontainebleau, Ouest de Paris conservateur (Versailles, Saint-Cloud, Saint-Nom-la-Bretèche, etc.) et la Corse.
Axe 4 :
Cet axe représente 4% de la variance. Cela est faible mais cet axe est néanmoins particulièrement intéressant à mon sens.
On remarque que, sur cet axe 4, les candidats qui ont des coefficients élevés sont les candidats Le Pen et Mégret essentiellement ainsi que Chevènement en 2002 et, de manière plus modérée, les candidats communistes, Sarkozy 2007 et le Oui de 2005. Je ne rentre pas dans le détail des candidats qui ont des coefficients ou négatifs sur cet axe car ils sont très nombreux, je remarque juste que les candidats NPA/LO apparaissent comme ceux qui ont les scores les plus faibles sur cet axe. On remarque également que le coefficient du candidat Le Pen (ou de la liste RN) sur cet axe a tendance à baisser fortement au fil du temps alors que le coefficient du même candidat sur l’axe 1 augmente tendanciellement (ex : en 2002, coefficients de 68% sur l’axe 1 et de 56% sur l’axe 2 ; en 2017, coefficients de 92% sur l’axe 1 et de 12% sur l’axe 2). Je nomme donc cet axe « FN canal historique ». Voici la carte de France correspondant à cet axe :
Lien image :
https://we.tl/t-hpE8WhYWnvLien PDF :
https://we.tl/t-abfBV0DUFkOn retrouve effectivement la carte des zones de force du FN historique (ça ressemble furieusement à la carte du FN 1984). Sans trop développer, les zones avec des scores élevés sont l’ensemble du littoral méditerranéen (enfin on retrouve enfin le survote FN sur cette carte !), le Vaucluse, la vallée de la Garonne, la région de Lyon, le Nord du Doubs, l’Alsace, l’intérieur de la Moselle et de la Meurthe-et-Moselle, une bonne partie de la région parisienne, l’Oise, l’Ouest de l’Aisne, le sud du Nord. Les zones à scores faibles sont assez nombreuses mais en particulier tout l’Ouest (à l’exception de quelques communes dans le golfe du Morbihan dont la Trinité sur Mer !), tout ce qui est au sud de la Garonne, le Massif central et la jonction jusqu’à l’Atlantique.
Maintenant que j’ai présenté ces cartes, je voudrais revenir sur quelques enseignements à en tirer. Je ne vais pas être exhaustif mais je crois intéressant de comparer les candidats en eux mais aussi d’observer l’évolution dans le temps du positionnement des candidats d’une même famille politique. Je donne quelques exemples qui me paraissent éclairants (Bayrou/Macron/LREM, Le Pen/RN, Chirac/Sarkozy/Fillon/LR, Jospin/Royal/Hollande-Melenchon/Hamon-Melenchon/LFI-PS-Gs).
Je commence donc (par Bayrou, Macron et LREM. Si on compare le Bayrou de 2007 au Macron de 2012, on remarque que Macron est nettement plus faible sur le 1er axe (-2% vs. 12%) alors qu’ils sont similaires sur les axes 2 et 3 (en particulier, ils sont tous les deux au centre gauche sur cette analyse). Cela signifie que Macron est plus rejeté par l’électorat « populaire-populiste » et plus favorisé par l’électorat « métropolitain » par rapport à Bayrou. Si on regarde le positionnement de la liste LREM, on remarque que ce rejet/adhésion s’est encore accentué aux européennes par rapport à 2017 (-16% sur l’axe 1 en 2019) et que la liste est maintenant positionnée sensiblement plus à droite (14% en 2017 vs. 39% sur l’axe 3 en 2017) – les choses restant stables sur l’axe 2. Il me semble qu’on a beaucoup souligné dans les résultats le glissement à droite de LREM (ce qui s’observe ici) mais pas du tout le premier point.
Si on regarde maintenant l’évolution des différents candidats Le Pen et de la liste RN, on observe une nette tendance au renforcement du coefficient sur l’axe 1 (en particulier entre 2002 et 2007), une situation relativement stable sur l’axe 2 (ça veut dire qu’il n’y a pas de renforcement disproportionné du RN dans les zones en difficulté industrielle par rapport à la moyenne nationale), une évolution un peu plus contrastée sur l’axe 3 (JMLP 2002 apparaissait plus à droite, sa fille moins à droite bien que la tendance aille en l’inversant depuis 2017) et enfin un net recul de la sensibilité par rapport à l’axe FN canal historique (observable clairement lors du passage du père à la fille en 2012 : on est à 56% en 2002 puis à 38% en 2007 pour le père et à 17% en 2012 puis 12% en 2017 pour la fille). Ceci explique donc pourquoi on n’observe pas particulièrement de dynamique RN en PACA : le sur-vote historique a tendance à s’estomper et l’accentuation à droite du RN est un peu moins forte que par le passé. J’en profite pour dire également qu’au regard de ces cartes, il n’y a pas deux RN mais peut-être quatre RN : un où le RN est en concurrence pour un électorat populaire avec des candidats de droite « populaire » (géographie de l’axe 1), un où le RN est en concurrence avec un électorat populaire dans des zones en déclin économique avec des candidats de gauche traditionnelle (géographie de l’axe 2), un où le RN est effectivement un parti d’extrême droite (axe 3) et, enfin un où le RN est l’héritage (qui tend à s’estomper) du FN historique avec, si concurrence il y a, une concurrence avec le PC.
Maintenant, on peut observer l’évolution des candidats de droite : Chirac, Sarkozy, Fillon et la liste LR 2019. Sur le 1er axe, on observe pas mal de variation mais on observe que Chirac et Sarkozy étaient relativement élevé sur cet axe (35% en 2002, 21% en 2007, 40% en 2012 à chaque fois au premier tour) alors que Fillon (16%) puis LR (9%) sont nettement plus faibles : cela indique une perte notable d’une partie de l’électorat populaire. Sur le 2ème axe, Chirac présente un score moins élevé que ses deux successeurs (Sarkozy 2007 et 2012 à 83%, Fillon à 90%) car probablement perçu comme moins libéral (Chirac 2002 est à 67% vs. Madelin à 75%). A noter que le score de la liste LR s’inscrit en retrait net (77% vs. LREM à 84%) – ce qui est cohérent avec le fait que les électeurs libéraux se soient tournés nettement vers LREM. On remarque sur le 3ème axe une nette droitisation des candidats après 2007 : Chirac est à -7%, Sarkozy 2007 à -2% mais Sarkozy 2012 à -12%, Fillon à -15% et LR 2019 à -21%. Enfin, sur le 4ème axe, on observe assez nettement le caractère exceptionnel du vote Sarkozy 2007 qui a capté une partie du vote FN canal historique : le score sur cet axe en 2007 est de 23% alors qu’il est de 2% en 2012, de -5% pour Fillon, -7% pour la liste LR 2019 et était de -6% pour Chirac en 2002.
Enfin, je termine par les candidats de gauche. On observe pas mal de variations sur les différents axes. Sur le 1er axe, Hollande (25%), Melenchon (35% en 2012, 12% en 2017) et Jospin (18%) obtiennent des scores corrects alors que Royal (-1%) et Hamon (-17%) présentent des scores plus marqués. On peut donc dire que Royal et Hamon apparaissent plus rejetés par les électeurs que j’ai nommé populaires-populistes. Sur le 2nd axe, Royal et Hollande apparaissent au même niveau (25%) alors Jospin est en retrait (14%). Le caractère plus antilibéral de Melenchon apparait clairement : il fait -1% en 2012 et 14% en 2017 (vs. Hamon à 46% - ce qui indique bien que des électeurs plus libéraux d’Hamon ont refusé de rejoindre Melenchon). Sur le 3ème axe (gauche), Jospin (68%) et Hamon (69%) apparaissent moins marqués (68%) que Royal (85%), Hollande (79%) ou Melenchon (autour de 80%). On voit donc qu’il s’agit là du seul réel point de stabilité des candidatures à gauche alors que les coalitions électorales au regard des deux premiers axes sont plus variables : on remarque néanmoins que le seul candidat leader de gauche ayant gagné a réalisé les scores les plus élevés (25%) sur les 2 premiers axes. Si on regarde maintenant par rapport à 2019, on est frappé par la similarité entre les coefficients PS et Generation.s avec les coefficients d’Hamon. En revanche, pour Melenchon vs. LFI, on voit clairement qu’il perd du terrain sur le 2nd axe de manière nette (14% en 2017, -25% en 2019). Je m’abstiens de commentaire sur les scores écologistes mais on voit quand même que le profil des coefficients est tout de même très différents de la gauche traditionnelle : en particulier, des coefficients nettement plus faibles sur le 1er axe par rapport aux candidats de gauche ayant eu traditionnellement le leadership et des coefficients nettement plus élevés sur le 2ème axe. Il n’est donc pas certain qu’il soit si aisé de faire une coalition de la gauche suffisamment large autour des écologistes (seuls les profils EELV, PS et Generation.s sont proches).
Je m’arrête là dans l’analyse. Je vous laisse explorer le tableau des coefficients vous-même pour le reste. Je signale juste qu’on peut dégager d’autres axes même s’ils sont plus marginaux en termes de contribution à la variance. Ces axes supplémentaires sont de trois types : il y a des axes qui sont communs à l’ensemble des élections mais concernent des familles politiques moins importantes (par exemple, il existe un axe qui explique le sur-vote/sous-vote écologiste et un autre le sur-vote/sous-vote communiste au-delà des 4 axes déjà identifiés), il y a des axes qui expliquent les différences de participation systématique pour un scrutin particulier (par exemple, le 5ème axe en termes d’explication de la variance est un axe qui est lié à l’abstention différentielle au 1er tour de 2002 avec l’Ile-de-France très clairement identifiée et le Sud-Ouest) et, enfin, il y a des axes qui expliquent la géographie particulière d’un candidat (pensez au vote Fillon autour de la Sarthe ou au vote Chirac autour de la Corrèze). Je peux fournir des cartes correspondant à ces différents axes si ça vous intéresse.
Je finis sur un dernier point : je n’ai pas trop parlé du positionnement des « petits » candidats par rapport aux axes, je vous laisse regarder ça vous-même. Analyser ça a en général un sens mais il faut faire attention aux conclusions qu’on en tire : pour certains petits candidats, la variance non expliquée par l’ensemble des 4 axes peut être très élevée (l’exemple caricatural est Asselineau et l’UPR qui ont des variances non expliquées supérieures à 85% – ce qui s’explique en réalité car il existe un axe mineur qui détermine ce vote-là, qui est donc très spécifique – ou le parti animaliste qui a une variance non expliquée de 92%).