Formation Initiation au Python scientifique
Python est actuellement l'un des seuls langages à proposer un environnement complet dédié à la recherche scientifique. Cette formation propose une initiation aux enjeux et techniques principaux du calcul numérique. Elle s'achève par trois applications autour de thématiques emblématiques : l'analyse statistique de donnée, l'apprentissage non-supervisé, le deep-learning.
Objectifs pédagogiques
- Connaître les principaux outils, distributions et bibliothèques scientifiques en Python
- Manipuler d'importants jeux de données
- Produire une visualisation pertinente de ces données pour en extraire de l'information
- Découvrir les techniques de base du calcul numérique
Formation Initiation au Python scientifique en détail
Programme
1. Rappel sur le langage Python
Cette partie comprend quelques rappels sur le langage Python. Nous traiterons :les types de données (nombre, chaîne de caractères, liste, dictionnaire, tuple), les structures de contrôles (if / else, while, for), les fonctions, les packages et modules. Nous en profiterons pour évoquer quelques limites du langage Python pour le calcul numérique avec notamment :
- les problèmes liés au stockage en mémoire
- les problèmes d'erreurs numériques
2. Ecosystème
Cette partie présente l'écosystème python pour le calcul scientifique. Nous passerons en revue les différentes bibliothèques scientifiques en Python, leur domaine d'utilisation et comment elles permettent de contourner les limites exposées dans la partie 1.
Nous installerons Anaconda, l'une des distributions les plus utilisées pour l'analyse scientifique de données. Nous verrons comment utiliser un éditeur de code ou les notebooks Jupyter ainsi que le gestionnaire de package, Conda.
3. Chargement et manipulation des données
Nous verrons comment les bibliothèques Numpy et Pandas permettent de charger des jeux de données, parfois même très volumineux. Nous apprendrons à accéder de manière efficace et intuitive à ces données.
4. Visualisation des résultats
Au travers des bibliothèques Matplotlib et Plotly, nous expérimenterons quelques techniques de visualisation des données. Nous verrons comment tirer quelques conclusions à partir de simples observations. Les graphiques réalisés pourront être statiques ou interactifs.
5. En option, une quatrième journée pourra permettre d'aborder au choix :
Chacune de ces applications sera l'occasion de mettre à nouveau en pratique les concepts étudiés dans les partie 3 et 4.
Le machine-learning
À l'aide des bibliothèques Scipy, Scikit-learn et TensorFlow, nous étudierons et mettrons en pratique quelques techniques de calcul numérique :analyse statistique et calcul des moments d'une variable aléatoire ;partitionnement automatique des données avec l'algorithme des k-moyennesintroduction au deep-learning et réseaux de neuronaux.
Le calcul parallèle
Après avoir compris les bases de la parallélisation en Python (multi-threading et multi-processing), nous verrons comment paralléliser divers applications via la bibliothèque Dask.
L’analyse de données géographiques
Nous verrons ensemble les spécificités des données géographiques avant de les manipuler à l’aide des bibliothèques GeoPandas (pour les données vectorielles) et Rasterio (pour les données raster). Leur représentation graphique pourra être réalisée de manière statique ou interactive.
Le traitement d’images
Nous passerons en revue les bibliothèques Python dédiées à l'analyse d'images. A l’aide de la bibliothèque Scikit-image notamment, nous metterons en place quelques traitements classiques d’analyse d’images dont :la binarisation, l’application de filtres de convolution, la segmentation d’image.
De plus, dans le cadre d'une formation intra-entreprise, un cas pratique ou jeu de données représentatif peut être fourni par l'entreprise afin que le formateur l'intègre dans le cursus.
Public visé et pré-requis
Public
- Toute personne travaillant dans des secteurs ayant de forts besoins en calculs et simulations mathématiques
- Informaticiens, scientifiques, chercheurs et ingénieurs travaillant dans les domaines comme les sciences physiques, la chimie, les sciences des matériaux, la génétique, la mécanique des fluides, l'aérospatiale, les statistiques, le monde de la finance, etc…
Pré-requis
- Expérience en programmation, de préférence en python
Personne en situation de handicap
Pour toutes questions relatives à l’accueil d’un participant présentant un handicap, merci de nous contacter préalablement avant toute inscription.
Prochaines sessions & tarifs
Formations IA / Data Science
Initiation au Python scientifique
Paris Du 15 au 17 octobre 2024
Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne
Formations IA / Data Science
Initiation au Python scientifique
À distance (FOAD) Du 2 au 6 décembre 2024
Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne
1 journée puis 4 demi-journées
Formations IA / Data Science
Initiation au Python scientifique
Nantes Du 25 au 27 mars 2025
Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne
Formations IA / Data Science
Initiation au Python scientifique
Toulouse Du 19 au 21 mai 2025
Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne
Formations IA / Data Science
Initiation au Python scientifique
À distance (FOAD) Du 23 au 27 juin 2025
Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne
1 journée puis 4 demi-journées
Formations IA / Data Science
Initiation au Python scientifique
Paris Du 15 au 17 octobre 2025
Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne
Formations IA / Data Science
Initiation au Python scientifique
À distance (FOAD) Du 1 au 5 décembre 2025
Durée : 3 jours soit 21 heures
Tarif : 1800 € ht par personne
1 journée puis 4 demi-journées
Ingénierie pédagogique
Moyens pédagogiques et techniques
- les supports de cours (slides) seront disponibles en ligne et distribués en début de formation (à l'aide d'un lien vers notre outil interne ou d'une version numérisée), puis fournis au format électronique à la fin de la formation
- une salle de formation équipée d'une connexion Internet, d'un vidéoprojecteur, paperboard…
- un ordinateur par stagiaire avec un système d'exploitation installé et les outils nécessaires
Modalités de suivi de l'exécution du programme
- durant la formation : alternance d'apports théoriques (35% du cours) et d’exercices pratiques et de mise en situation sous forme de travaux pratiques corrigés avec l’expert-formateur
-
en fin de formation : évaluation à chaud sur l'atteinte des objectifs pédagogiques sous forme de tour de table et de test de connaissances, d'exercices, de QCM
Moyens d'encadrement
- Formation assurée par un expert Python connaissant les librairies scientifiques
Témoignage
Experts Initiation au Python scientifique
Daphné Lercier
Chercheuse en géomatique
Mickaël Carlos
Chargé de recherche et développement-Django-python.