Accueil / Formations / Valoriser des données dormantes avec le Machine Learning

Valoriser des données dormantes avec le Machine Learning

Démarrez en toute sérénité vos projets de Machine Learning : cette formation vous donnera les connaissances nécessaires pour identifier les applications vous permettant une valorisation rapide des données dormantes que stocke votre entreprise. Nous verrons comment analyser ces dernières, les nettoyer et vérifier qu'elles satisfont les pré-requis propres à chaque type de méthodes. Nous vous donnerons les bases pour réaliser rapidement des visualisations capables de les mettre en valeur. Enfin, nous étudierons les solutions de Machine Learning ayant fait leur preuve.

Objectifs pédagogiques

  • Être capable de déterminer si vos données sont adéquates pour une application de type Machine Learning
  • Savoir créer rapidement une visualisation pertinente pour vos données
  • Connaître les architectures les plus célèbres en Machine Learning et Deep Learning
  • Être capable d'identifier les problèmes pouvant bénéficier de ce type d'approche

Programme

Partie I : Introduction

  • Introduction au Machine Learning : principes, concepts de bases
  • Quelques exemples d'applications
  • Dans quel cas de figure peut-on utiliser du Machine Learning ?

Partie II : Préparer ses données avec Numpy et Pandas

  • Numpy : traitement de données numériques à N dimensions
  • Pandas : traitement des données tabulaires et séries temporelles
  • Rechercher les données erronées
    • par la visualisation : Seaborn, Ploty, Folium, Superset
    • algorithmes détection automatiques d'outliers : Isolation Forest, Local Outlier Factor, Elliptic Envelope
    • clustering avec détection du bruit : HDBSCAN
  • Ecarter ou corriger les erreurs
  • Constituer un jeu de tests et un ensemble de données d'apprentissage
  • Pré-traitements usuels : PCA, normalisation, centrage

Partie III : Data Visualisation

  • Règles de bases pour une Data Viz pertinente
  • Quels types de graphiques pour quels usages
  • Jupyter Notebook
  • Seaborn : graphique statistique
  • Folium : données cartographiques
  • Superset et MapBox
  • Plotly

Partie IV : Utilisation des méthodes standards de Machine Learning

  • Pour quel type d'applications ?
  • Skicit-learn
  • Validation croisée
  • Automatisation de la recherche d'une méthode adéquate : AutoSklearn et TPOT
  • Sauvegarde d'un modèle entraîné

Partie V : Utilisation du Deep Learning

  • Les problèmes maîtrisés
  • Architectures reconnues
  • Tests rapides avec Keras

Sessions (Toulouse, Nantes, Paris)

  • du 18 au 20 déc.
    Paris
  • du 02 au 04 avril
    Paris
  • du 17 au 19 déc.
    Paris

Nous contacter

Public

  • Développeurs
  • Chefs de projets

Pré-requis

  • Connaître les bases de la programmation en Python (structures de données et de contrôle, fonctions, bases de la POO)

Durée

3 jour(s) soit 21 heures

Prix

1500 € par personne

Moyens pédagogiques et techniques

  • les supports de cours (slides) seront disponibles en ligne et distribués en début de formation (à l'aide d'un lien vers notre outil interne ou d'une version numérisée), puis fournis au format électronique à la fin de la formation

  • une salle de formation équipée d'une connexion Internet, d'un vidéoprojecteur, paperboard...

  • un ordinateur par stagiaire avec un système d'exploitation installé et les outils nécessaires

Modalités de suivi de l'exécution du programme

  • durant la formation : alternance d'apports théoriques (30% du cours) et d’exercices pratiques et de mise en situation sous forme de travaux pratiques corrigés avec l’expert-formateur

  • en fin de formation : évaluation à chaud sur l'atteinte des objectifs pédagogiques sous forme de tour de table et de test de connaissances, d'exercices, de QCM

Moyens d'encadrement

  • Formation assurée par un expert maîtrisant les concepts de l'intelligence artificielle