Prérequis
Connaissances de base en bases de données et en SQL Notions générales en Cloud ou en solutions analytiques
Durée
2 jours
Contenu Technique de la Formation
La formation aborde les contenus techniques suivants :
- Principes du Data Warehousing moderne et comparaison avec les approches traditionnelles
- Modélisation dimensionnelle : tables de faits, dimensions, modèles en étoile et en flocon
- Concepts et rôles d’un Data Lake dans la gestion de données massives
- Le Lakehouse : architecture hybride combinant Data Lake et Data Warehouse
- Présentation de Databricks Lakehouse Platform et du Delta Lake
- Gestion des données dans Databricks : ingestion, transformation, stockage et gouvernance
- Cas d’usage typiques : analytique avancée, Machine Learning, BI temps réel
- Bonnes pratiques de conception, sécurité et monitoring dans un environnement Databricks
Objectifs de la Formation
Le Data Warehousing moderne et l’approche Lakehouse avec Databricks permettent aux organisations de répondre aux besoins croissants en stockage, traitement et valorisation des données. Cette formation met l’accent sur la modélisation dimensionnelle et l’utilisation concrète de Databricks pour concevoir et exploiter un Lakehouse. Les compétences visées par la formation sont les suivantes :
- Expliquer les principes d’un Data Warehouse moderne et ses différences avec les entrepôts classiques
- Mettre en œuvre une modélisation dimensionnelle simple (tables de faits et dimensions)
- Comprendre le rôle du Lakehouse dans une architecture analytique moderne
- Utiliser Databricks et Delta Lake pour gérer, transformer et stocker des données
- Identifier des cas d’usage pertinents pour l’approche Lakehouse
- Appliquer des bonnes pratiques de gouvernance et de sécurité avec Databricks
Table des Matières
Introduction
- Évolution du Data Warehousing
- Limites des architectures classiques
- Enjeux du Big Data et du Cloud
Modélisation dimensionnelle
- Tables de faits et de dimensions
- Schémas en étoile et en flocon
- Contraintes et bonnes pratiques
Data Lake et gouvernance
- Concepts et architecture du Data Lake
- Formats ouverts (Parquet, Delta Lake)
- Catalogues, traçabilité et conformité
Le Lakehouse
- Convergence Data Lake – Data Warehouse
- Cas d’usage analytiques et IA
- Avantages et limites
Databricks Lakehouse Platform
- Présentation de l’écosystème Databricks
- Delta Lake et gestion des données transactionnelles
- Notebooks collaboratifs et Spark SQL
- Intégration avec Power BI et outils BI
En Pratique
- Les exercices proposés lors de la formation permettent d’illustrer les concepts et de les mettre en pratique :
- Exercice de modélisation d’un mini Data Warehouse (tables de faits et dimensions)
- Création d’un schéma en étoile simple et interrogation avec Spark SQL
- Mise en place d’un Lakehouse avec Databricks et Delta Lake
- Chargement, transformation et analyse d’un jeu de données réel dans Databricks
- Exercice récapitulatif : conception d’une architecture analytique complète dans Databricks Lakehouse
Modalités et Inscription
Cette formation est proposée selon deux formules pour s'adapter au mieux à vos besoins :
Session régulière
Des sessions sont organisées à intervalles réguliers. Demandez les prochaines dates planifiées pour vous inscrire à la prochaine session.
Sur mesure & intra-entreprise
Vous souhaitez former vos équipes directement dans vos locaux ou adapter le programme technique à votre contexte d'entreprise ? Contactez-nous pour obtenir un devis personnalisé.