Makina Blog

Le blog Makina-corpus

Formation à distance Data Scientist


Grâce à l'adaptation de nos formations pour une offre à distance, un programme pédagogique complet autour des data-sciences vous est proposé, couvrant : le chargement, la manipulation, la visualisation et l'utilisation en machine learning de vos données.

Afin d'éviter la propagation du Covid-19 et d'assurer la sécurité de nos clients, une nouvelle gamme de formation à distance a été mise en place. Une transposition directe des formations données jusqu'à présent en présentiel n'est pas toujours évidente car une partie importante de leur qualité repose sur la richesse des échanges entre nos formateurs et stagiaires.

Néanmoins le format « à distance » ouvre aussi de nouvelles possibilités. C'est dans ce contexte là que Makina Corpus a ressorti son idée d'une formation complète en data science découpée en 11 ateliers pratiques et 3 mises en pratique.

En présentiel, cette formation est plus complexe à mettre en place. Ainsi, ce nouveau format de formation à distance couvre 4 programmes :

Même s'il existe des similitudes entre ces programmes, 12 jours seraient nécessaires aux formateurs et stagiaires pour suivre l'intégralité de cette formation en présentiel. Une trop longue durée à la fin de laquelle l'énergie manquerait sans doute pour enseigner comme pour assimiler toutes les notions.

La formation à distance au contraire permet d'organiser facilement 11 ateliers d'environ 4 heures chacun. Ces ateliers sont accompagnés de 3 sessions de mise en pratique supervisée : vous choisissez un sujet en rapport avec votre métier ou parmi une liste que nous vous proposons et durant 4 heures, nos formateurs vous accompagnent pour l'explorer efficacement.

Cette formation à distance se programme sur 1 mois, avec 3 à 4 ateliers par semaine. L'ensemble de la formation dure 56 heures. Nous décidons ensemble du créneau de chaque atelier. Entre 2 ateliers, le participant à la possibilité de pratiquer puis d'échanger avec nos formateurs qui répondront avec plaisir à toutes ses questions.

 

Déroulé de la formation

Atelier 1 : Introduction à l'univers scientifique de Python

Session 1 : Mise en pratique supervisée

Atelier 2 : Manipulation d'images

Atelier 3 : Manipulation de données temporelles

Atelier 4 : Manipulation de données géolocalisées

Les bibliothèques pour charger, manipuler et visualiser des données cartographiques sont à part dans l'écosystème scientifique. En plus des bibliothèques Pandas  et Matplolib, nous ajouterons à notre boîte à outil : Folium, Cartopy et GeoPandas.

Atelier 5 : Préparer les données pour du Machine Learning

Atelier 6 : Apprentissage supervisé

L'apprentissage supervisé consiste à entraîner un algorithme d'apprentissage automatique en lui fournissant des données d'apprentissage ainsi que le résultat attendu pour ces dernières. Cet atelier donne les clés pour utiliser n'importe quel algorithme par apprentissage supervisé.

Nous continuerons à découvrir les fonctionnalités de scikit-learn.

Atelier 7 : Apprentissage non-supervisé

Atelier 8 : Introduction aux concepts fondamentaux du Deep Learning

Session 2 : Mise en pratique supervisée

Atelier 9 : Deep learning pour l'analyse de la langue orale

Durant cet atelier, nous entraînerons un réseau de neurones à différencier des fichiers sonores.

Nous poursuivrons notre découverte de la bibliothèque Keras.

Atelier 10 : Deep learning pour l'analyse de la langue écrite

Atelier 11 : Deep learning pour l'analyse de la langue des signes

Session 3 : Mise en pratique supervisée

 

Ces ateliers vous intéressent ?

Retrouver tous les détails des programmes atelier par atelier sur notre catalogue formation ici.

Créez votre formation sur mesure !

Vous avez déjà exploré un des ateliers ? Vous auriez envie d'un module supplémentaire sur la programmation parallèle, l'utilisation de Tensorboard ou n'importe quelle problématique disponible dans notre offre de formation ? N'hésitez pas, notre équipe sera ravie d'adapter ce programme avec vous !

Formations associées

Formations IA / Data Science

Formation Machine Learning

Nantes - Toulouse - Paris ou distanciel A la demande

Voir la Formation Machine Learning

Formations IA / Data Science

Formation Python scientifique

Toulouse Du 1 au 5 juin 2026

Voir la Formation Python scientifique

Formations IA / Data Science

Formation Jupyter Notebook

A distance (FOAD) Le 16 avril 2025

Voir la Formation Jupyter Notebook

Actualités en lien

Mati­nales Digi­forma 2026 : les nouveau­tés clés pour les orga­nismes de forma­tion

12/02/2026

Toujours leader des solu­tions SaaS dédiées aux orga­nismes de forma­tion, Digi­forma a orga­nisé une nouvelle édition de ses Mati­nales le jeudi 12 février à Icilundi. À cette occa­sion, nous avons pu rencon­trer leurs équipes et décou­vrir les évolu­tions majeures à venir.
Voir l'article
Image

Makina Corpus Forma­tion : le bilan 2024–2025 en chiffres et pers­pec­tives

02/02/2026

L’an­née 2024–2025 marque une nouvelle étape dans le déve­lop­pe­ment de Makina Corpus Forma­tion, avec une acti­vité soute­nue et une adap­ta­tion conti­nue aux évolu­tions du secteur.
Voir l'article
Image
Formation catalogue 2023

Mati­née avec l’édi­teur de la solu­tion Digi­forma

17/04/2025

En tant qu’or­ga­nisme de forma­tion, nous suivons de près l’ac­tua­lité de l’édi­teur de la solu­tion de gestion des forma­tions que nous utili­sons depuis plusieurs années : Digi­forma.
Voir l'article
Image

Inscription à la newsletter

Nous vous avons convaincus