Prérequis
Connaissances de base en Business Intelligence
Durée
1 jour
Contenu Technique de la Formation
La formation aborde les contenus techniques suivants :
- Introduction au Big Data : concepts et enjeux
- Écosystème Hadoop : HDFS, MapReduce, YARN
- Outils de traitement de données en temps réel (Apache Spark, Kafka)
- Stockage NoSQL (Cassandra, MongoDB)
- Outils d'analyse de données (Hive, Pig)
- Introduction à l'apprentissage automatique avec Big Data
- Gestion, sécurité et gouvernance des données
Objectifs de la Formation
Les objectifs visés par cette formation sont :
- Comprendre les concepts fondamentaux du Big Data
- Se familiariser avec l'écosystème Hadoop et ses composants
- Apprendre à utiliser des outils de traitement de données en temps réel
- Comprendre les principes et l'utilisation des bases de données NoSQL
- Acquérir des compétences dans l'analyse de données Big Data
- Introduction aux concepts de l'apprentissage automatique dans le Big Data
- Connaître les aspects de gestion, de sécurité et de gouvernance des données
Table des Matières
Introduction au Big Data
- Définition et importance du Big Data dans le contexte actuel
- Types de données : structurées, semi-structurées, non structurées
- Sources de données Big Data et exemples d'applications
Écosystème Hadoop
- Composants de base : HDFS, MapReduce, YARN
- Architecture et fonctionnement de Hadoop
- Installation et configuration d'un cluster Hadoop
Outils de Traitement de Données en Temps Réel
- Présentation d'Apache Spark et Kafka
- Traitement des flux de données (streaming data)
- Exemples d'application et mise en pratique
Stockage NoSQL
- Présentation des bases de données NoSQL : Cassandra, MongoDB
- Choix d'une base de données en fonction des besoins
- Principes de conception et d'utilisation des bases NoSQL
Outils d'Analyse et Apprentissage Automatique
- Utilisation de Hive et Pig pour l'analyse de données
- Principes de base de l'apprentissage automatique avec Big Data
- Outils et bibliothèques (Apache Mahout)
Gestion, Sécurité et Gouvernance des Données
- Enjeux de la gestion des données Big Data
- Aspects de sécurité et de confidentialité
- Politiques et meilleures pratiques de gouvernance des données
En Pratique
- La formation d’algorithmique de base est fortement orientée sur la pratique. Les participants ont l’occasion de mettre en pratique les différentes notions théoriques enseignées tout au long de la formation.
- Installation et configuration d'un mini-cluster Hadoop
- Réalisation de traitements de données avec Spark et Kafka
- Manipulation de données avec des bases de données NoSQL
- Analyse de données avec Hive et Pig
- Exercices d'introduction à l'apprentissage automatique
Modalités et Inscription
Cette formation est proposée selon deux formules pour s'adapter au mieux à vos besoins :
Session régulière
Des sessions sont organisées à intervalles réguliers. Demandez les prochaines dates planifiées pour vous inscrire à la prochaine session.
Sur mesure & intra-entreprise
Vous souhaitez former vos équipes directement dans vos locaux ou adapter le programme technique à votre contexte d'entreprise ? Contactez-nous pour obtenir un devis personnalisé.