Makina Blog

Le blog Makina-corpus

Makina Corpus collabore avec l'Ecole Nationale des Sciences Géographiques pour le développement de l'outil geolabel-maker


Dans le cadre de nos activités R&D, Makina Corpus a proposé à Arthur Dujardin, étudiant de l’École Nationale des Sciences Géographiques, de contribuer aux développements de l'outil geolabel-maker.

Arthur Dujardin, en dernière année du cycle d'ingénieur de l'École Nationale des Sciences Géographiques, suit la filière PPMD (Photogrammétrie, Positionnement et Mesures de déformations) après une année à étudier à l'Université d'Oslo où il s'est spécialisé en Intelligence Artificielle (deep-learning) et traitement d'images. Depuis octobre, il travaille sur la création automatique de jeux d'apprentissage pour la cartographie par deep-learning avec Daphné Lercier, chercheuse chez Makina Corpus.

La cartographie par deep-learning

L'ouverture de données d'imagerie aérienne ou satellitaire de plus en plus précises, couplée avec l'arrivée d'algorithmes d'intelligence artificielle de plus en plus performants, révolutionne les pratiques en cartographie numérique. Désormais, les réseaux de neurones sont fréquemment sollicités pour les opérations de reconnaissance d'objets ou de détection de changements. Ces algorithmes font partie des algorithmes dits d'apprentissage supervisé dans la mesure où ils s'ajustent à partir d'un jeu de données d'apprentissage composé de différents exemples accompagnés du résultat attendu pour chacun.

Lorsque nous cherchons à localiser des objets (bâtiments ou zones végétalisées par exemple) dans des images aériennes, l'apprentissage du modèle de deep-learning choisi se base sur un jeu d'images et l'ensemble des positions des objets recherchés.

Geolabel-maker

Pour faciliter la création de ces jeux de données d’apprentissage, l’outil « geolabel-maker » a récemment été développé. Cet outil est disponible en open-source sur GitHub et permet de générer les couples d'images (image, label) à partir de données vecteurs et rasters hétéroclites.

Le jeu de données d'apprentissage produit peut également être fourni au format COCO. Le fonctionnement de l'outil est décrit dans le notebook Use_geolabel_maker, ainsi que dans la suite de tutoriels sur le blog de Makina Corpus.

Améliorations à venir

Le travail d'Arthur va permettre d'ajouter de nouvelles fonctionnalités à l'outil.

Il va tout d'abord permettre la récupération de données directement depuis des sources de données externes via des web services. Les images pourront donc être téléchargées depuis l'API Mapbox ou SentinelSat. Les géométries des objets étudiés pourront quant à elles être obtenues par extraction de données d'OpenStreetMap.

Le chargement de données sera également possible depuis une base de données PostGis.

Quant aux jeux de données d'apprentissage produits, ils pourront désormais répondre à d'avantage de besoins. Il sera notamment possible de créer un jeu de données prêt à l'emploi pour les modèles de classification d'images.

En attendant, si vous avez besoin d'aide dans vos projets de deep-learning, n'hésitez pas à nous contacter.

Formations associées

Front end

VueJS

Nantes Du 18 au 20 octobre 2022

Voir la formation

SIG/Web mapping

Tuiles vectorielles

A distance Du 6 au 7 décembre 2022

Voir la formation

Django

Django avancé

A distance (foad) Du 7 au 9 novembre 2022

Voir la formation

Actualités en lien

Image
Encart article Canari
06/07/2022 - 10:00

CANARI, un logiciel libre sous licences GPL et CeCILL

Dans cet article, nous revenons sur les licences libres et plus spécifiquement sur celles utilisées sur le projet Canari.

Voir l'article
Image
video-conference
30/06/2022 - 11:00

Le télétravail chez Makina Corpus : de ses origines à l'arrivée du Covid

Depuis mars 2020, les équipes de Makina Corpus ont revu leur façon de travailler en mettant en place le télétravail. Après deux ans d'expérience, nous dressons le bilan de ces deux années et des changements qu'elles ont apportées dans notre entreprise.

Voir l'article
Image
Chatons association
29/06/2022 - 10:30

CHATONS, un hébergeur près de chez vous

CHATONS est le Collectif des Hébergeurs Alternatifs, Transparents, Ouverts, Neutres et Solidaires. Il a été créé en 2016 par Framasoft et fait suite à la campagne Dégooglisons Internet.

Voir l'article

Inscription à la newsletter

Nous vous avons convaincus