Makina Blog
Makina Corpus collabore avec l'Ecole Nationale des Sciences Géographiques pour le développement de l'outil geolabel-maker
Dans le cadre de nos activités R&D, Makina Corpus a proposé à Arthur Dujardin, étudiant de l’École Nationale des Sciences Géographiques, de contribuer aux développements de l'outil geolabel-maker.
Arthur Dujardin, en dernière année du cycle d'ingénieur de l'École Nationale des Sciences Géographiques, suit la filière PPMD (Photogrammétrie, Positionnement et Mesures de déformations) après une année à étudier à l'Université d'Oslo où il s'est spécialisé en Intelligence Artificielle (deep-learning) et traitement d'images. Depuis octobre, il travaille sur la création automatique de jeux d'apprentissage pour la cartographie par deep-learning avec Daphné Lercier, chercheuse chez Makina Corpus.
La cartographie par deep-learning
L'ouverture de données d'imagerie aérienne ou satellitaire de plus en plus précises, couplée avec l'arrivée d'algorithmes d'intelligence artificielle de plus en plus performants, révolutionne les pratiques en cartographie numérique. Désormais, les réseaux de neurones sont fréquemment sollicités pour les opérations de reconnaissance d'objets ou de détection de changements. Ces algorithmes font partie des algorithmes dits d'apprentissage supervisé dans la mesure où ils s'ajustent à partir d'un jeu de données d'apprentissage composé de différents exemples accompagnés du résultat attendu pour chacun.
Lorsque nous cherchons à localiser des objets (bâtiments ou zones végétalisées par exemple) dans des images aériennes, l'apprentissage du modèle de deep-learning choisi se base sur un jeu d'images et l'ensemble des positions des objets recherchés.
Geolabel-maker
Pour faciliter la création de ces jeux de données d’apprentissage, l’outil « geolabel-maker » a récemment été développé. Cet outil est disponible en open-source sur GitHub et permet de générer les couples d'images (image, label) à partir de données vecteurs et rasters hétéroclites.
Le jeu de données d'apprentissage produit peut également être fourni au format COCO. Le fonctionnement de l'outil est décrit dans le notebook Use_geolabel_maker, ainsi que dans la suite de tutoriels sur le blog de Makina Corpus.
Améliorations à venir
Le travail d'Arthur va permettre d'ajouter de nouvelles fonctionnalités à l'outil.
Il va tout d'abord permettre la récupération de données directement depuis des sources de données externes via des web services. Les images pourront donc être téléchargées depuis l'API Mapbox ou SentinelSat. Les géométries des objets étudiés pourront quant à elles être obtenues par extraction de données d'OpenStreetMap.
Le chargement de données sera également possible depuis une base de données PostGis.
Quant aux jeux de données d'apprentissage produits, ils pourront désormais répondre à d'avantage de besoins. Il sera notamment possible de créer un jeu de données prêt à l'emploi pour les modèles de classification d'images.
En attendant, si vous avez besoin d'aide dans vos projets de deep-learning, n'hésitez pas à nous contacter.
Formations associées
Formations SIG / Cartographie
Formation Tuiles vectorielles
À distance (FOAD) Du 3 au 4 juin 2025
Voir la formationFormations Django
Formation Django avancé
À distance (FOAD) Du 9 au 13 décembre 2024
Voir la formationActualités en lien
Nouvelle Journée Technique du PRNSN : le numérique dans les pratiques sportives de nature
Le 27 novembre 2024, Montpellier accueille la 18e Journée technique du réseau national des sports de nature, organisée par le PRNSN.
Mini-guide à l’usage des collectivités : l’Open Data, entre nécessité et opportunité
Tout ce que vous avez toujours voulu savoir sur l’Open Data. Petit guide à destination des collectivités pour l’appréhender et se l’approprier.
Makina Corpus, sponsor et conférencier au Capitole du Libre 2024
Les 16 et 17 novembre à Toulouse, Makina Corpus s’engage aux côtés de la communauté du logiciel libre en sponsorisant le Capitole du Libre. Ne manquez pas la conférence de notre expert Drupal, Simon George.