Accueil / Formations / Formation Talend Open Studio

Formation Talend Open Studio

Talend Open Studio s’impose comme LA solution d'intégration de données Open Source, puissante et ouverte, permettant de répondre avec efficacité à un très large éventail de besoins : alimentation de Datawarehouse, synchronisation de bases de données, transformation de fichiers de divers formats (XML, délimités, positionnels...).

Objectifs

  • Prendre en main Talend Open Studio
  • Traduire ses besoins en jobs Talend
  • Maîtriser la bibliothèque de composants
  • Savoir déboguer et déployer ses jobs

Programme

1. Présentation

  • Pourquoi utiliser un ETL
  • Panorama des outils Propriétaires & Open Source
  • Installation de Talend Open Studio (TOS)
  • Présentation des concepts de Talend Open Studio

2. Réaliser son premier job

Lecture, tri et export d'un fichier CSV sous divers formats (CSV, XML, Excel, SGBDR)
  • Le business modeler: pourquoi ne pas l'utiliser
  • Savoir trouver ses composants
  • Savoir choisir les bonnes connexions
  • Tester son job
  • L'exécuter en ligne de commande et automatiser son exécution
  • Versionner votre job
  • Documenter votre job

3. Découverte des principaux composants au travers d'un cas d'étude XML

  • Export et import de données au format XML
  • Découverte des principaux composants
    Jointure, Consultation des données, Tri, Suppression de doublons, Filtres, Agrégation
  • Maîtriser un des composants phares : le tMap
    • Types de jointures
    •  Flux de sortie multiples
    • Filtres
    • Identifier les enregistrements en erreur
  • Découvrir son homologue, le tXMLMap

4. Gérer et partager ses données entre jobs: le Référentiel de métadonnées et les contextes

  • Les métadonnées et schémas de données
  • Les paramètres de contexte et environnements d'exécution (groupes de contextes):
    • Au niveau local d'un job
    • Au niveau global du projet
    • Paramétrer vos métadonnées avec les contextes
  • Initialiser automatiquement les paramètres du job avec des fichiers de configuration

5. Travailler avec les bases de données relationnelles : consolider un entrepôt de données

  • Les connexions aux bases de données
  • Partager des connexions entre les jobs
  • Générer des jeux de données aléatoires pour initialiser vos bases
  • Exercices de consolidation de données
  • Optimisations et erreurs à éviter
  • Sécurité de vos mots de passe

6. Utilisation des composants de développement java

  • Réaliser des traitements spécifiques avec du code Java
  • Bien comprendre le fonctionnement des 3 composants tJava, tJavaRow et tJavaFlex
  • Partager des variables entre les composants (globalMap) et des paramètres de contextes
  • Développer des libraires Java

7. Logs et debuggage

  • Débugger rapidement avec le tLogRow
  • Debugger les erreurs avec le debugger Java
  • Sauvegarder automatiquement des logs et statistiques sur l'exécution de vos jobs dans des fichiers ou en base de données
  • Les différents composants de Log
  • Utiliser Log4j

8. Talend dans la vie quotidienne

  • S’appuyer sur la communauté Talend
  • Installer des composants tierces
  • Conseils et bonnes pratiques d'utilisation
  • Comprendre les limites de l'outil
  • Savoir ou trouver des solutions à vos différents problèmes d'utilisation, il y en aura...
  • La littérature Talend

Consultez nos tutoriaux Talend Data Integration.

Sessions (Toulouse, Nantes, Paris)

Nous contacter

Public

Chef de projet, Ingénieur système / DBA, Administrateurs de base de données, Consultants en informatique décisionnelle/BI, Statisticiens, scientifiques manipulant de grandes quantités de données, Intégrateurs de données

Pré-requis

  • Connaissance du XML, des SGBDR et du SQL
  • Des notions en langage Java seront un plus

Ces pré-requis seront contrôlés et validés sous forme d’entretien téléphonique réalisé au plus tard 2 semaines avant la formation.

En cas de non adéquation, des solutions alternatives seront proposées.

Durée

3 jour(s) soit 21 heures

Prix

1500 € par personne

Moyens pédagogiques et techniques

  • les supports de cours (slides) seront disponibles en ligne et distribués en début de formation (à l'aide d'un lien vers notre outil interne ou d'une version numérisée), puis fournis au format électronique à la fin de la formation

  • une salle de formation équipée d'une connexion Internet, d'un vidéoprojecteur, paperboard...

  • un ordinateur par stagiaire avec un système d'exploitation installé et les outils nécessaires

Modalités de suivi de l'exécution du programme

  • durant la formation : alternance d'apports théoriques (25%) et d’exercices pratiques et de mise en situation sous forme de travaux pratiques corrigés avec l’expert-formateur

  • en fin de formation : évaluation à chaud sur l'atteinte des objectifs pédagogiques sous forme de tour de table et de test de connaissances, d'exercices, de QCM

Moyens d'encadrement

  • Formation assurée par un expert Talend Open Studio

"Formation très riche, complète et dynamique. Elle a répondu à nos attentes. Le formateur a su transmettre la théorie et nous impliquer dans les exercices pratiques."

Stéphane - ATREAL

"La progressivité des exercices mêlée aux compétences pédagogiques et à l’expérience du formateur m’ont permis
Atreal
d’appréhender Talend rapidement."


Benjamin - ATREAL