Makina Blog
Open Data et élections, des progrès à faire
Pour la mise en place de cartes par bureau de vote, nous avons cherché à récupérer des données des plateformes Open Data françaises. Il y a encore du travail ;-)
Réalisation de la carte
Le webmapping est une de nos spécialités. Nous essayons, quand nous en avons l'occasion, de réaliser des cartes sur des sujets de société, pour montrer notre savoir-faire (comme par exemple en 2014 pour les élections municipales) et acquérir de la visibilité.
La plupart des résultats étant disponibles en Open Data, c'est l'occasion de montrer ce qu'il est possible d'obtenir en réutilisant des données librement disponibles… Mais tout n'est pas si facile dans le monde de l'Open Data.
Récupération des données
En effet, si la carte en elle-même ne pose pas de souci majeur (mais nous verrons dans un autre article de blog que quelques astuces sont quand même utilisées), la récupération des données elle-même est un premier challenge. Un des enjeux étant la rapidité de réalisation des cartes concernant l'élection (pour permettre la reprise dans des journaux en ligne, nous avons fait le tour des principales plateformes Open Data françaises : Toulouse, Bordeaux, Montpellier, Rennes et Nantes (Paris et Lyon n'étant pas concernées par cette élection).
Bordeaux et Nantes ont été directement éliminées de nos recherches, ne diffusant (au jour de notre test, soit 3 jours après l'élection) aucune donnée sur leurs plateformes respectives. Les autres sites diffusant tous des données, nous avons donc tentés de créer les cartes correspondantes.
Analyse des données
La première étape de la plupart de nos cartes est de décider à quelle échelle nous allons effectuer la représentation : régions, départements, cantons, commune ? Notre objectif premier était de réaliser une carte des résultats par bureau de vote, parce que d'abord tout le monde aime voir ce que fait son proche voisin, ensuite parce que sur cette élection, la plupart des journaux fournissaient déjà la carte par canton.
Montpellier, Rennes et Toulouse fournissent toutes les 3 un découpage des bureaux de vote, mais dans le cas de Rennes, ce ne sont que des points (et pas des polygones représentant des zones, permettant une visualisation plus agréable car immédiatement reconnaissable). En plus de cela, plusieurs bureaux de vote peuvent être présents au même endroit, rendant la colorisation d'un seul bureau de vote difficile (d'autant que le fichier de découpage des bureaux incluait tous les bureaux dans le même champ (exemple : "1 - 2 - 3") et augmentait d'autant le travail de transformation des données. Pris par le temps, nous sommes donc passés à une autre ville.
Le découpage de Montpellier est lui en parfaits polygones (voir http://opendata.montpelliernumerique.fr/Bureaux-de-vote), contenant des métadonnées correctement formatées pour chaque bureau de vote. Cependant, dans le fichier des résultats, le parti de chaque candidat (nécessaire pour la colorisation des zones de la carte et de la légende) n'était pas indiqué (*). La plateforme Open Data de Montpellier ne contenant pas de fichier de liste de candidats pouvant contenir le parti, cette ville a également été mise de côté, le temps de traitement nécessaire à la recherche des partis des différents candidats (plusieurs cantons, donc plus de partis à chercher que pour l'élection municipale de 2014) étant pénalisant.
Reste Toulouse, qui fournit également le découpage des bureaux de vote et les résultats de l'élection. Cette fois encore, il manque la couleur politique des candidats, mais un travail préliminaire nous amenant à tester une saisie des résultats collaboratives sur un Google Spreadsheet (voir notre site dédié aux cartes des élections), nous avions déjà cette information. Toutes les données étant en notre possession, nous avons décidé de réaliser la carte des résultats du vote à Toulouse, par bureau de vote.
(*): la Ville de Montpellier nous signale qu'il n'est pas légalement autorisé de mentionner le nom du parti dans le fichier de résultats, seuls les noms des candidats peuvent y figurer.
Transformation des données
Nous n'étions alors pas au bout de nos surprises : les résultats de Toulouse sont données dans des champs "listeA", "listeB", … alors que nous avions à notre disposition les couleurs politiques des "1, 2, 3, 4, 5". Nous avons (naïvement) utilisé une simple correspondance alphabétique pour mettre les deux en adéquation. Erreur !
Il fallait utiliser un autre fichier, listant les candidats, pour faire correspondre le champ "idListeA" avec le numéro de panneau correspondant… Heureusement, nos transformations étant déjà transformées en script, il nous a suffit d'adapter le script en question, de le relancer, et voilà.
A retenir : dès lors qu'une transformation de données est impliquée, ne jamais la réaliser à la main, toujours automatiser, vous ne savez pas à l'avance combien de fois vous aurez à la refaire.
Résultat final
Finalement, après quelques actes manqués, nous avons obtenu la carte des résultats de Toulouse, par bureau de vote… Mais la conclusion reste que les plateformes Open Data, si elles fournissent de plus en plus de données, ne sont pas encore complètement au point sur la data traitable automatiquement, et c'est souvent le processus d'analyse / traitement des données qui vous prendra le plus de temps sur une visualisation.
Ne boudons pas notre plaisir, le webmapping fournit quand même souvent des résultats vraiment jolis, alors profitons-en !
N'hésitez pas à nous contacter pour réaliser des cartes personnalisées avec vos données.
Actualités en lien
Mini-guide à l’usage des collectivités : l’Open Data, entre nécessité et opportunité
Tout ce que vous avez toujours voulu savoir sur l’Open Data. Petit guide à destination des collectivités pour l’appréhender et se l’approprier.
Une rentrée riche autour de la donnée et des rencontres pour Makina Corpus Territoires
Chaque rentrée apporte son lot d’opportunités pour faire avancer les projets autour de la données au service des territoires. Le calendrier de Makina Corpus en la matière a été particulièrement dense en événements.
GeoDatadays 2024 : retrouvez-nous et participez à nos conférences
Les 19 et 20 septembre, participez aux conférences animées par nos experts SIG aux GeoDataDays 2024, en Pays de la Loire à Nantes.