Références : ils nous font confiance
Application web pour le matching de données textuelles hétéroclites
Le Groupe Dubreuil a sollicité Makina Corpus pour concevoir une solution permettant d'associer des données issues de diverses sources à un référentiel créé et maintenu par leurs experts métiers. Accessible via une application web, la rapidité de celle-ci assure une utilisation confortable aux utilisateurs qui effectuent des recherches. Cet outil interne porte des enjeux stratégiques importants pour l'entreprise, c'est pourquoi certains détails techniques ou métier restent confidentiels dans ce projet.
Première étape, Makina Corpus a proposé un audit pour analyser les données et réaliser des tests afin :
- de faire émerger des pistes de développement utilisant des outils de machine learning ou non
- d'imaginer une première solution répondant à la problématique
Les algorithmes conçus ont été spécialisés et entraînés. Ensuite, un outil web a été proposé pour faciliter la démonstration aux équipes du Groupe Dubreuil qui seront amenées à utiliser la solution de matching. Suite à la démonstration, un atelier UX a eu lieu pour collecter les retours utilisateurs et surtout avoir la vision métier nécessaire pour développer un outil industrialisable et sur-mesure. Les sources de données sont amenées à évoluer, l'application est capable de poursuivre son apprentissage en prenant en compte les retours réalisés par les utilisateurs (nouvelle version à venir).
Le Groupe Dubreuil
Le groupe Dubreuil est une entreprise familiale qui s'est diversifiée autour de sept métiers au fil des décennies : automobile, aérien, matériels BTP, énergies, machinisme, agricole, poids lourd, hôtellerie, immobilier. Basée en Vendée, c'est aujourd’hui le premier groupe vendéen en termes de chiffre d'affaires.
Projet : Outil web pour le matching de données hétéroclites
+Info
Le Groupe Dubreuil a souhaité développer une solution logicielle permettant de réaliser de la mise en correspondance de produits.
Article présentant une partie de la démarche du projet : Mise en correspondance de données textuelles hétéroclites.
L'application web est opérationnelle et en production. Le renforcement des réseaux de neurones est prévu quand l'outil aura été suffisamment utilisé pour augmenter la vérité terrain.
Challenge
- Gestion des données textuelles qui peuvent être en plusieurs langues
- Gestion de noms propres absents des lexiques usuels
- Mise en place de la solution dans un laps de temps réduit
Solution
- Réalisation d’un audit pour mettre en exergue les différents enjeux à priorisés
- Conversion des données textuelles sous une forme numérique (les données textuelles ne peuvent pas être utilisées directement par une méthode de Machine Learning) en associant un nombre à chaque mot
- Mise en place d’un POC (preuve de concept) pour confirmer le développement spécifique de la solution la plus adaptée.
Expertise
- Réseau de neurones de type Word2Vec
- Application web basée sur Django et React
- Machine Learning
- Keras
Formez-vous
Formations IA / Data Science
Formation Mise en place de projets Deep Learning avec Keras
Toulouse Du 19 au 21 mars 2025
Voir la Formation Mise en place de projets Deep Learning avec KerasFormations IA / Data Science
Formation Python scientifique
Nantes Du 27 au 21 janvier 2025
Voir la Formation Python scientifiqueFormations Django
Formation Django REST Framework
À distance (FOAD) Du 9 au 13 juin 2025
Voir la Formation Django REST Framework