Accueil / Formations / Ateliers Data Science en FOAD

Ateliers Data Science en FOAD

Nos experts continuent de vous accompagner à distance dans votre apprentissage avec Python. Nous vous proposons désormais une série de 11 ateliers de 4 heures chacun qui résultent d'une fusion de nos 4 programmes de formations : Python Scientifique / Data Science, Deep Learning, Notebook Jupyter et Machine Learning.

Objectifs pédagogiques

  • Utiliser les principales librairies de calcul numérique dont Numpy, SciPy, Pandas et Matplotlib
  • Paralléliser ses traitements sur des architectures modernes permettant le calcul distribué
  • Etre capable de créer un notebook Jupyter
  • Savoir mettre en forme des résultats
  • Etre capable d'utiliser des options et/ou bibliothèques complémentaires
  • Etre capable d'utiliser des widgets
  • Être capable d'identifier les problèmes pour lesquels une solution Deep Learning est pertinente
  • Connaître les spécificités de la bibliothèque TensorFlow
  • Connaître les strutures classiques pour un réseau de neurone
  • Savoir implémenter ces architectures avec TensorFlow et Keras
  • Comprendre en quoi consiste l'apprentissage automatique
  • Identifier les problèmes pour lesquels ce type de méthode saura apporter une réponse pertinente
  • Connaître les différents types de méthodes et savoir utiliser les principaux algorithmes

Programme

Atelier 1 : Introduction à l'univers scientifique de Python

Lors de ce premier atelier, nous découvrirons ensemble l'univers scientifique de Python.

Au programme

  • une mise à niveau rapide en Python
  • la découverte des notebooks jupyter
  • une série de travaux pratiques qui nous permettent d'illustrer les concepts fondamentaux de la démarche scientifique et du Machine Learning

Mise en pratique supervisé n°1

Atelier 2 : Manipulation d'images

L'objectif de cet atelier est de vous donner les bases en traitement et analyse d'images. Les récentes avancées en Machine Learning ne seront pas abordées car nous les réservons pour les ateliers suivants.

Cet atelier sera l'occasion de découvrir les bibliothèques NumpyPillowMatplolibScikit-Image

Atelier 3 : Manipulation de données temporelles

Nous verrons comment stocker, charger, analyser et visualiser des données temporelles. Nous découvrirons les bibliothèques suivantes Pandas et Seaborn.

Atelier 4 : Manipulation de données géolocalisées

Les bibliothèques pour charger, manipuler et visualiser des données cartographiques sont à part dans l'écosystème scientifique. En plus des bibliothèques Pandas  et Matplolib, nous ajouterons à notre boîte à outil : FoliumCartopy et GeoPandas.

Atelier 5 : Préparer les données pour du Machine Learning

Dans la majorité des cas, un algorithme d'apprentissage automatique n'utilise pas directement les données dont nous disposons. Cet atelier présente les principales méthodes visant à adapter les données.

Au programme

  • normalisation / standardisation
  • décomposition en composantes principales
  • équilibrage des données
  • conversion des données visuelles (images et vidéos)
  • conversion des données textuelles

Nous utiliserons principalement la bibliothèque scikit-learn.

Atelier 6 : Apprentissage supervisé

L'apprentissage supervisé consiste à entraîner un algorithme d'apprentissage automatique en lui fournissant des données d'apprentissage ainsi que le résultat attendu pour ces dernières. Cet atelier donne les clés pour utiliser n'importe quel algorithme par apprentissage supervisé.

Au programme

  • présenter les principales méthodes par apprentissage supervisé
  • montrer comment ce type d'algorithme est entraîné
  • expliquer comment l'évaluer correctement

Nous continuerons à découvrir les fonctionnalités de scikit-learn.

Atelier 7 : Apprentissage non-supervisé

L'apprentissage non-supervisé concerne les cas de figure où nous ne disposons que des données mais pas du résultat attendu pour ces données. Les algorithmes d'apprentissage non-supervisé vont permettre une exploration et une catégorisation de ces données.  L'objectif vous donne les clés pour utiliser ce type d'algorithme.

Au programme

  • présentation des deux principales catégories d'algorithmes d'apprentissage non-supervisé : méthodes par partitionnement et méthodes hiérarchiques
  • entraînement de ce type d'algorithme
  • discussion autour de l'évaluation : les principales métriques et leurs limites

Nous continuerons à découvrir les fonctionnalités de scikit-learn.

Mise en pratique supervisé n°2

Chaque stagiaire choisit un sujet et y travaille durant 4 heures.

Atelier 8 : Introduction aux concepts fondamentaux du deep learning

Présentation des concepts fondamentaux du deep learning.

Cet atelier sera l'occasion de découvrir la bibliothèque Keras.

Atelier 9 : Deep learning pour l'analyse de la langue orale

Durant cet atelier, nous entraînerons un réseau de neurones à différencier des fichiers sonores.

Au programme

  • créer un réseau séquentiel avec Keras
  • choisir  une méthode d'optimisation
  • choisir une fonction de coût
  • charger efficacement les données avec un générateur
  • entraîner le réseau de neurones
  • évaluer ses performances

Nous poursuivrons notre découverte de la bibliothèque Keras.

Atelier 10 : Deep learning pour l'analyse de la langue écrite

Nous verrons comment un réseau de neurones peut être entraîné à identifier des liens sémantiques entre les mots. Cet atelier constituera une initiation au traitement naturel du langage.  

Au programme

  • les modèles word2vec : des mots aux vecteurs
  • l'utilisation d'un réseau pré-entraîné
  • les architectures siamoises

Nous poursuivrons notre découvert de la bibliothèque Keras.

Atelier 11 : Deep learning pour l'analyse de la langue des signes

L'objectif est de vous initier au deep learning pour l'analyse d'images.

Au programme

  • étudier les particularités des modèles pour l'analyse d'images
  • utiliser un générateur de données pour les images
  • spécialiser un  réseau de neurones pour de la classification d'images
  • pour terminerons par quels mots sur les réseaux de neurones pour la localisation ou la segmentation d'objets

Cet atelier sera l'occasion de découvrir les bibliothèques suivantes  : Keras / Tensorflow

Mise en pratique supervisé n°3

Chaque stagiaire choisit un sujet et y travaille durant 4 heures.

En résumé

Voici une formation complète en data science découpée en 11 ateliers et 3 mises en pratique surpervisées.

Ce nouveau référentiel s'inspire de 4 programmes :

Même s'il existe des similitudes entre tous, les objectifs ici c'est de mettre en pratique les concepts de chacune des formations.

La formation à distance au contraire permet d'organiser facilement 11 ateliers d'environ 4 heures chacun. Ces ateliers sont accompagnés de 3 sessions de mise en pratique supervisée : vous choisissez un sujet en rapport avec votre métier ou parmi une liste que nous vous proposons et durant 4 heures, nos formateurs vous accompagnent pour l'explorer efficacement.

Cette formation à distance se programme sur 1 mois, avec 3 à 4 ateliers par semaine. L'ensemble de la formation dure 56 heures. Nous décidons ensemble du créneau de chaque atelier. Entre 2 ateliers, le participant à la possibilité de pratiquer puis d'échanger avec nos formateurs qui répondront avec plaisir à toutes vos questions.


Tarifs

Tarif individuel par atelier : 375€ HT / participant 

Exemples : 3 ateliers 1125€ HT, 4 ateliers 1500€ HT etc

Le programme complet pour une inter-entreprise : 3 500€ HT / participant

Pour une intra-entreprise jusqu'à 5 participants maximum : 8 750€ HT

Pour toutes questions, écrivez-nous à : formation@makina-corpus.com

Sessions (Toulouse, Nantes, Paris)

  • du 02 au 11 déc.
    A distance (FOAD)

Nous contacter

Public

  • Toute personne travaillant dans des secteurs ayant de forts besoins en calculs et simulations mathématiques
  • Informaticiens, scientifiques, chercheurs et ingénieurs travaillant dans les domaines comme les sciences physiques, la chimie, les sciences des matériaux, la génétique, la mécanique des fluides, l'aérospatiale, les statistiques, le monde de la finance, etc...

Pré-requis

  • Connaître l'algorithmie
  • Avoir une première expérience du langage Python
  • Connaître quelques rudiments mathématiques, trigonométrie (sinus, cosinus) et algèbre linéaire (calcul matriciel)

Ces pré-requis seront contrôlés et validés sous forme d’entretien téléphonique réalisé au plus tard 2 semaines avant la formation.

En cas de non adéquation, des solutions alternatives seront proposées.

Durée

7 jour(s) soit 49 heures

Prix

3500 € par personne

Moyens pédagogiques et techniques

  • les supports de cours (slides) seront disponibles en ligne au début de formation (à l'aide d'un lien vers notre outil interne ou d'une version numérisée), puis fournis au format électronique à la fin de la formation

  • une salle de formation virtuelle équipée d'un espace de chat, d'un partage d'écran et d'un tableau blanc

  • les pré-requis logiciels seront envoyés par le formateur quelques jours avant le démarrage de la session

  • les stagiaires doivent se munir d'un ordinateur avec une connexion internet via ADSL ou Fibre (pas de 3 ou 4G)

  • l'équipement d'un casque avec micro est préférable, des écouteurs peuvent aussi suffirent

Modalités de suivi de l'exécution du programme

  • durant les ateliers : alternance d'apports théoriques, d’exercices pratiques et de mise en situation sous forme de travaux supervisés et corrigés avec l’expert-formateur

  • en fin de formation : évaluation à chaud sur l'atteinte des objectifs pédagogiques sous forme de tour de table et de test de connaissances, d'exercices, de QCM

Moyens d'encadrement

Formation assurée par un(e) expert(e) Python connaissant les librairies scientifiques.