Formation Initiation au Python scientifique

Python est actuellement l'un des seuls langages à proposer un environnement complet dédié à la recherche scientifique. Cette formation propose une initiation aux enjeux et techniques principaux du calcul numérique. Elle s'achève par trois applications autour de thématiques emblématiques : l'analyse statistique de donnée, l'apprentissage non-supervisé, le deep-learning.

Objectifs pédagogiques

  • Connaître les principaux outils, distributions et bibliothèques scientifiques en Python
  • Manipuler d'importants jeux de données
  • Produire une visualisation pertinente de ces données pour en extraire de l'information 
  • Découvrir les techniques de base du calcul numérique

Formation Initiation au Python scientifique en détail

Programme

1. Rappel sur le langage Python

Cette partie comprend quelques rappels sur le langage Python. Nous traiterons :les types de données (nombre, chaîne de caractères, liste, dictionnaire, tuple), les structures de contrôles (if / else, while, for), les fonctions, les packages et modules. Nous en profiterons pour évoquer quelques limites du langage Python pour le calcul numérique avec notamment :

  • les problèmes liés au stockage en mémoire 
  • les problèmes d'erreurs numériques

2. Ecosystème

Cette partie présente l'écosystème python pour le calcul scientifique. Nous passerons en revue les différentes bibliothèques scientifiques en Python, leur domaine d'utilisation et comment elles permettent de contourner les limites exposées dans la partie 1.

Nous installerons Anaconda, l'une des distributions les plus utilisées pour l'analyse scientifique de données. Nous verrons comment utiliser un éditeur de code ou les notebooks Jupyter ainsi que le gestionnaire de package, Conda.

3. Chargement et manipulation des données

Nous verrons comment les bibliothèques Numpy et Pandas permettent de charger des jeux de données, parfois même très volumineux. Nous apprendrons à accéder de manière efficace et intuitive à ces données.

4. Visualisation des résultats

Au travers des bibliothèques Matplotlib et Plotly, nous expérimenterons quelques techniques de visualisation des données. Nous verrons comment tirer quelques conclusions à partir de simples observations. Les graphiques réalisés pourront être statiques ou interactifs.

5. En option, une quatrième journée pourra permettre d'aborder au choix :

Chacune de ces applications sera l'occasion de mettre à nouveau en pratique les concepts étudiés dans les partie 3 et 4.

Le machine-learning

À l'aide des bibliothèques Scipy, Scikit-learn et TensorFlow, nous étudierons et mettrons en pratique quelques techniques de calcul numérique :analyse statistique et calcul des moments d'une variable aléatoire ;partitionnement automatique des données avec l'algorithme des k-moyennesintroduction au deep-learning et réseaux de neuronaux.

Le calcul parallèle

Après avoir compris les bases de la parallélisation en Python (multi-threading et multi-processing), nous verrons comment paralléliser divers applications via la bibliothèque Dask.

L’analyse de données géographiques

Nous verrons ensemble les spécificités des données géographiques avant de les manipuler à l’aide des bibliothèques GeoPandas (pour les données vectorielles) et Rasterio (pour les données raster). Leur représentation graphique pourra être réalisée de manière statique ou interactive.

Le traitement d’images

Nous passerons en revue les bibliothèques Python dédiées à l'analyse d'images. A l’aide de la bibliothèque Scikit-image notamment, nous metterons en place quelques traitements classiques d’analyse d’images dont :la binarisation, l’application de filtres de convolution, la segmentation d’image.

De plus, dans le cadre d'une formation intra-entreprise, un cas pratique ou jeu de données représentatif peut être fourni par l'entreprise afin que le formateur l'intègre dans le cursus.

Public visé et pré-requis

Public

  • Toute personne travaillant dans des secteurs ayant de forts besoins en calculs et simulations mathématiques
  • Informaticiens, scientifiques, chercheurs et ingénieurs travaillant dans les domaines comme les sciences physiques, la chimie, les sciences des matériaux, la génétique, la mécanique des fluides, l'aérospatiale, les statistiques, le monde de la finance, etc…

Pré-requis

  • Expérience en programmation, de préférence en python

Personne en situation de handicap

Pour toutes questions relatives à l’accueil d’un participant présentant un handicap, merci de nous contacter préalablement avant toute inscription.

Prochaines sessions & tarifs

Formations IA / Data Science

Initiation au Python scientifique

Paris Du 15 au 17 octobre 2024

Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne

Formations IA / Data Science

Initiation au Python scientifique

À distance (FOAD) Du 2 au 6 décembre 2024

Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne

1 journée puis 4 demi-journées

Formations IA / Data Science

Initiation au Python scientifique

Nantes Du 25 au 27 mars 2025

Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne

Formations IA / Data Science

Initiation au Python scientifique

Toulouse Du 19 au 21 mai 2025

Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne

Formations IA / Data Science

Initiation au Python scientifique

À distance (FOAD) Du 23 au 27 juin 2025

Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne

1 journée puis 4 demi-journées

Formations IA / Data Science

Initiation au Python scientifique

Paris Du 15 au 17 octobre 2025

Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne

Formations IA / Data Science

Initiation au Python scientifique

À distance (FOAD) Du 1 au 5 décembre 2025

Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne

 

1 journée puis 4 demi-journées

Ingénierie pédagogique

Moyens pédagogiques et techniques

  • les supports de cours (slides) seront disponibles en ligne et distribués en début de formation (à l'aide d'un lien vers notre outil interne ou d'une version numérisée), puis fournis au format électronique à la fin de la formation
  • une salle de formation équipée d'une connexion Internet, d'un vidéoprojecteur, paperboard…
  • un ordinateur par stagiaire avec un système d'exploitation installé et les outils nécessaires

Modalités de suivi de l'exécution du programme

  • durant la formation : alternance d'apports théoriques (35% du cours) et d’exercices pratiques et de mise en situation sous forme de travaux pratiques corrigés avec l’expert-formateur
  • en fin de formation : évaluation à chaud sur l'atteinte des objectifs pédagogiques sous forme de tour de table et de test de connaissances, d'exercices, de QCM

Moyens d'encadrement

  • Formation assurée par un expert Python connaissant les librairies scientifiques

Témoignage

Experts Initiation au Python scientifique

Daphné Lercier

Chercheuse en géomatique


Nantes
Mickaël Carlos

Mickaël Carlos

Chargé de recherche et développement-Django-python.


Toulouse