Makina Blog
Makina Corpus collabore avec l'Ecole Nationale des Sciences Géographiques pour le développement de l'outil geolabel-maker
Dans le cadre de nos activités R&D, Makina Corpus a proposé à Arthur Dujardin, étudiant de l’École Nationale des Sciences Géographiques, de contribuer aux développements de l'outil geolabel-maker.
Arthur Dujardin, en dernière année du cycle d'ingénieur de l'École Nationale des Sciences Géographiques, suit la filière PPMD (Photogrammétrie, Positionnement et Mesures de déformations) après une année à étudier à l'Université d'Oslo où il s'est spécialisé en Intelligence Artificielle (deep-learning) et traitement d'images. Depuis octobre, il travaille sur la création automatique de jeux d'apprentissage pour la cartographie par deep-learning avec Daphné Lercier, chercheuse chez Makina Corpus.
La cartographie par deep-learning
L'ouverture de données d'imagerie aérienne ou satellitaire de plus en plus précises, couplée avec l'arrivée d'algorithmes d'intelligence artificielle de plus en plus performants, révolutionne les pratiques en cartographie numérique. Désormais, les réseaux de neurones sont fréquemment sollicités pour les opérations de reconnaissance d'objets ou de détection de changements. Ces algorithmes font partie des algorithmes dits d'apprentissage supervisé dans la mesure où ils s'ajustent à partir d'un jeu de données d'apprentissage composé de différents exemples accompagnés du résultat attendu pour chacun.
Lorsque nous cherchons à localiser des objets (bâtiments ou zones végétalisées par exemple) dans des images aériennes, l'apprentissage du modèle de deep-learning choisi se base sur un jeu d'images et l'ensemble des positions des objets recherchés.
Geolabel-maker
Pour faciliter la création de ces jeux de données d’apprentissage, l’outil « geolabel-maker » a récemment été développé. Cet outil est disponible en open-source sur GitHub et permet de générer les couples d'images (image, label) à partir de données vecteurs et rasters hétéroclites.
Le jeu de données d'apprentissage produit peut également être fourni au format COCO. Le fonctionnement de l'outil est décrit dans le notebook Use_geolabel_maker, ainsi que dans la suite de tutoriels sur le blog de Makina Corpus.
Améliorations à venir
Le travail d'Arthur va permettre d'ajouter de nouvelles fonctionnalités à l'outil.
Il va tout d'abord permettre la récupération de données directement depuis des sources de données externes via des web services. Les images pourront donc être téléchargées depuis l'API Mapbox ou SentinelSat. Les géométries des objets étudiés pourront quant à elles être obtenues par extraction de données d'OpenStreetMap.
Le chargement de données sera également possible depuis une base de données PostGis.
Quant aux jeux de données d'apprentissage produits, ils pourront désormais répondre à d'avantage de besoins. Il sera notamment possible de créer un jeu de données prêt à l'emploi pour les modèles de classification d'images.
En attendant, si vous avez besoin d'aide dans vos projets de deep-learning, n'hésitez pas à nous contacter.
Formations associées
Formations SIG / Cartographie
Formation Tuiles vectorielles
À distance (FOAD) Du 3 au 4 juin 2024
Voir la formationFormations Django
Formation Django avancé
À distance (FOAD) Du 9 au 13 décembre 2024
Voir la formationActualités en lien
Makina Corpus, partenaire du DrupalCamp 2024
Nous sommes fiers d’annoncer que Makina Corpus est le sponsor du DrupalCamp à Rennes. Notre expert vous y propose une conférence « migrer de Drupal 7 à Drupal 10 ».
Générer un fichier PMTiles avec Tippecanoe
Exemple de génération et d’affichage d’un jeu de tuiles vectorielles en PMTiles à partir de données publiques.
Meetup AFUP Nantes de février : parlons anonymisation avec le DbToolsBundle Symfony
Notre expert Symfony/PHP prend la parole au Meet-up de l’AFUP pour présenter le nouveau bundle Symfony développé par Makina Corpus : le DbToolsBundle !