Menu

FORMATIONS / DONNEES DU SI / Big Data

BD-001  Big Data |  2 jours


01/. Introduction

La philosophie NoSQL ; Différences entre bases relationnelles et  NoSQL ; Architecture distribuée ; Le format JSON comme format d'échange ; Exemples de bases NoSQL : Base orientée clés-valeurs : Cassandra ; Base orientée "colonnes" : HadoopBase volatile : memcache.Base orientée "documents" : MongoDB.

02/. Prise en main de Hadoop

Mise en œuvre d'un Cluster ; Utilisation de HDFS ; 1er exemple de MapReduce.

03/. Ecriture d'un algo.map/reduce

Application Java ; Les différentes étapes ; Utilisation d'autres langages.

04/. Administration

Configuration ; Modèle de sécurité ; Gestion de HDFS ; Gestion des nœuds ; Gestion des tâches.

05/. Pour aller plus loin

De MySQL à HDFS ; De MySQL à Hive ; Collecte de données avec FLUME.

06/. Prise en main de Mongodb

Concepts de base ; Documents ; Types intégrés ; Collections ; Bases de données.

07/. Manipulation de documents

Insertion ; Suppression ; Mise à jour ; Remplacement ; Gestion des tableaux ; Upserts ; Opérations atomiques.



08/. Langage d'interrogations

La méthode find() ; Critères de recherche ; Opérateurs spécifiques ; Recherche dans les tableaux ; Curseurs ; Options avancées ; Snapshots.

09/. Indexation

Index simple et multiple ; Informations et conseils sur les index ; Changer les index ; Index géospatial.

10/. Requêtes d'agrégation

Agrégation simple ; Comptage ; Commande group() ; Algorithme MapReduce ; Framework d'agrégation ; Pipelines ; Intégration avec Hadoop.

11/. Administration

Démarrage ; Fichier de configuration ; Arrêt ; Surveillance du service ; Sécurité et authentification ; Journalisation ; Commandes de gestion.

12/. Réplication

Principe ; Mise en oeuvre d'un Replica Set ; Administration du Replica Set.

13/. Cluster et Sharding

Définition du sharding et des chunks ; Choix de la clé de sharding ; Mise en oeuvre d'un cluster ; Ajout et suppression de serveurs ; Administration du cluster.



Public
Chefs de projets, managers et développeurs souhaitant approfondir leurs connaissances des enjeux du Big Data.

Objectifs
Connaitre le principe du Big Data avec deux technologies phares : le cluster Hadoop et MongoDB, leader des bases de données.

Prérequis
Connaissances de base Linux.

Moyens pédagogiques
1 ordinateur et 1 support de cours par personne + 1 vidéoprojecteur. Évaluation par écrit en fin de cours et attestation de stage délivrée en fin de formation.  

VOS DATES DE FORMATION