Makina Blog

Le blog Makina-corpus

Formation à distance Data Scientist


Grâce à l'adaptation de nos formations pour une offre à distance, un programme pédagogique complet autour des data-sciences vous est proposé, couvrant : le chargement, la manipulation, la visualisation et l'utilisation en machine learning de vos données.

Afin d'éviter la propagation du Covid-19 et d'assurer la sécurité de nos clients, une nouvelle gamme de formation à distance a été mise en place. Une transposition directe des formations données jusqu'à présent en présentiel n'est pas toujours évidente car une partie importante de leur qualité repose sur la richesse des échanges entre nos formateurs et stagiaires.

Néanmoins le format « à distance » ouvre aussi de nouvelles possibilités. C'est dans ce contexte là que Makina Corpus a ressorti son idée d'une formation complète en data science découpée en 11 ateliers pratiques et 3 mises en pratique.

En présentiel, cette formation est plus complexe à mettre en place. Ainsi, ce nouveau format de formation à distance couvre 4 programmes :

Même s'il existe des similitudes entre ces programmes, 12 jours seraient nécessaires aux formateurs et stagiaires pour suivre l'intégralité de cette formation en présentiel. Une trop longue durée à la fin de laquelle l'énergie manquerait sans doute pour enseigner comme pour assimiler toutes les notions.

La formation à distance au contraire permet d'organiser facilement 11 ateliers d'environ 4 heures chacun. Ces ateliers sont accompagnés de 3 sessions de mise en pratique supervisée : vous choisissez un sujet en rapport avec votre métier ou parmi une liste que nous vous proposons et durant 4 heures, nos formateurs vous accompagnent pour l'explorer efficacement.

Cette formation à distance se programme sur 1 mois, avec 3 à 4 ateliers par semaine. L'ensemble de la formation dure 56 heures. Nous décidons ensemble du créneau de chaque atelier. Entre 2 ateliers, le participant à la possibilité de pratiquer puis d'échanger avec nos formateurs qui répondront avec plaisir à toutes ses questions.

 

Déroulé de la formation

Atelier 1 : Introduction à l'univers scientifique de Python

Session 1 : Mise en pratique supervisée

Atelier 2 : Manipulation d'images

Atelier 3 : Manipulation de données temporelles

Atelier 4 : Manipulation de données géolocalisées

Les bibliothèques pour charger, manipuler et visualiser des données cartographiques sont à part dans l'écosystème scientifique. En plus des bibliothèques Pandas  et Matplolib, nous ajouterons à notre boîte à outil : Folium, Cartopy et GeoPandas.

Atelier 5 : Préparer les données pour du Machine Learning

Atelier 6 : Apprentissage supervisé

L'apprentissage supervisé consiste à entraîner un algorithme d'apprentissage automatique en lui fournissant des données d'apprentissage ainsi que le résultat attendu pour ces dernières. Cet atelier donne les clés pour utiliser n'importe quel algorithme par apprentissage supervisé.

Nous continuerons à découvrir les fonctionnalités de scikit-learn.

Atelier 7 : Apprentissage non-supervisé

Atelier 8 : Introduction aux concepts fondamentaux du Deep Learning

Session 2 : Mise en pratique supervisée

Atelier 9 : Deep learning pour l'analyse de la langue orale

Durant cet atelier, nous entraînerons un réseau de neurones à différencier des fichiers sonores.

Nous poursuivrons notre découverte de la bibliothèque Keras.

Atelier 10 : Deep learning pour l'analyse de la langue écrite

Atelier 11 : Deep learning pour l'analyse de la langue des signes

Session 3 : Mise en pratique supervisée

 

Ces ateliers vous intéressent ?

Retrouver tous les détails des programmes atelier par atelier sur notre catalogue formation ici.

Créez votre formation sur mesure !

Vous avez déjà exploré un des ateliers ? Vous auriez envie d'un module supplémentaire sur la programmation parallèle, l'utilisation de Tensorboard ou n'importe quelle problématique disponible dans notre offre de formation ? N'hésitez pas, notre équipe sera ravie d'adapter ce programme avec vous !

Formations associées

Formations IA / Data Science

Formation Machine Learning

Nantes Du 1 au 3 avril 2025

Voir la Formation Machine Learning

Formations IA / Data Science

Formation Python scientifique

Toulouse Du 31 mars au 4 avril 2025

Voir la Formation Python scientifique

Formations IA / Data Science

Formation Jupyter Notebook

Nantes - Toulouse - Paris ou distanciel A la demande

Voir la Formation Jupyter Notebook

Actualités en lien

Calcu­lez sur GPU avec Python – Partie 3/3

20/02/2025

Dans cette troi­sième partie, nous compren­drons dans quelles circons­tances un GPU est vrai­ment préfé­rable à un CPU et comment compi­ler votre code Python sur GPU avec Numba.
Voir l'article
Image
Article 3/3 Calculez sur GPU avec Python

Calcu­­lez sur GPU avec Python – Partie 2/3

11/02/2025

Dans cette partie, vous appren­drez à utili­ser votre GPU avec les librai­ries CuPy et PyCUDA. Vous commen­ce­rez à comprendre dans quelles condi­tions un GPU est préfé­rable à un CPU.
Voir l'article
Image
Cartes graphiques - GPU

Calcu­lez sur GPU avec Python – Partie 1/3

04/02/2025

Cet article vous présente comment utili­ser des GPU avec Python en passant par la présen­ta­tion du choix du maté­riel jusqu’à sa mise en œuvre avec diffé­rentes librai­ries : Cupy, cuDF, xarray…
Voir l'article
Image
Visuel Python

Inscription à la newsletter

Nous vous avons convaincus