Formation Azure sur l'ingénierie des données

Objectifs de la formation :

Explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données dans Azure. Concevoir et mettre en œuvre la couche de service. Interpréter les considérations relatives à l'ingénierie des données. Exécuter des requêtes interactives à l'aide de pools SQL sans serveur. Explorer, transformer et charger des données dans l'entrepôt de données à l'aide d'Apache Spark. Effectuer l'exploration et la transformation des données dans Azure Databricks. Ingérer et charger des données dans l'entrepôt de données. Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines. Intégrer les données des ordinateurs portables avec Azure Data Factory ou Azure Synapse Pipelines. Optimiser les performances des requêtes avec des pools SQL dédiés dans Azure Synapse. Analyser et optimiser le stockage dans l'entrepôt de données. Prendre en charge le traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link. Assurer la sécurité de bout en bout avec Azure Synapse Analytics. Effectuer un traitement de flux en temps réel avec Stream Analytics. Créer une solution de traitement en continu avec Event Hubs et Azure Databricks. Créer des rapports à l'aide de l'intégration Power BI avec Azure Synpase Analytics. Exécuter des processus d'apprentissage automatiques intégrés dans Azure Synapse Analytics.

Public :

Professionnels des données, aux architectes de données et aux professionnels de la veille stratégique qui souhaitent se familiariser avec l'ingénierie des données et la création de solutions analytiques à l'aide des technologies de plateforme de données qui existent sur Microsoft Azure. Les Data Analyst et les Data Scientist qui travaillent avec des solutions analytiques construites sur Microsoft Azure.
Si vous êtes en situation de handicap, merci de nous contacter.

Accessibilité de la formation :

Vertego s'engage pour l'accessibilité de la formation pour tous.
Consultez notre page dédiée pour plus d'informations.
Si vous êtes en situation de handicap et devez bénéficier d'aménagements spécifiques, contactez notre référente handicap Lydie DUPEYRON en cliquant ici

Prérequis :

Évaluation diagnostique réalisée en amont. Avoir une connaissance du cloud computing, des concepts de données de base et une expérience professionnelle des solutions de données. Ou avoir suivi les programmes "Microsoft Azure - Les fondamentaux dans les bases de données"(MS-DP900) et "Microsoft Azure - Principes de base" (MS-AZ900).

Délai d'accès :

Inscriptions possibles jusqu'à 48h avant le début de la formation.
Si votre formation est financée via le CPF, prévoir un délai de 15 jours.

Profil formateur :

Cette formation est animée par un formateur certifié

Description
du programme

01. Explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données

Introduction à Azure Synapse Analytics
Description d'Azure Databricks
Introduction au stockage Azure Data Lake
Décrire l'architecture Delta Lake
Travailler avec des flux de données à l'aide d'Azure Stream Analytics
Lab1 : explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données
Combiner le traitement en continu et le traitement par lots avec un seul pipeline
Organiser le lac de données en niveaux de transformation de fichiers
Indexer le stockage du lac de données pour accélérer les requêtes et les charges de travail.

02. Concevoir et mettre en œuvre la couche de service

Concevoir un schéma multidimensionnel pour optimiser les charges de travail analytiques
Transformation sans code à l'échelle avec Azure Data Factory
Remplissage de dimensions à évolution lente dans les pipelines Azure Synapse Analytics
Lab 2 : conception et mise en œuvre de la couche de service
Conception d'un schéma en étoile pour les charges de travail analytiques
Remplissage de dimensions à évolution lente avec Azure Data Factory et mappage des flux de données

03. Considérer l'ingénierie des données pour les fichiers sources

Concevoir un entrepôt de données moderne à l'aide d'Azure Synapse Analytics
Sécuriser un entrepôt de données dans Azure Synapse Analytics
Lab 3 : considérations relatives à l'ingénierie des données
Gestion des fichiers dans un lac de données Azure
Sécurisation des fichiers stockés dans un lac de données Azure

04. Exécuter des requêtes interactives à l'aide des pools SQL sans serveur Azure Synapse Analytics

Explorer les fonctionnalités des pools SQL sans serveur Azure Synapse
Interroger les données dans le lac à l'aide des pools SQL sans serveur Azure Synapse
Créer les objets de métadonnées dans les pools SQL sans serveur Azure Synapse
Sécuriser les données et gérer les utilisateurs dans les pools SQL sans serveur Azure Synapse
Lab 4 : Exécution de requêtes interactives à l'aide de pools SQL sans serveur
Interroger des données Parquet avec des pools SQL sans serveur
Créer des tables externes pour les fichiers Parquet et CSV
Créer des vues avec des pools SQL sans serveur
Sécuriser l'accès aux données dans un lac de données en utilisant des pools SQL sans serveur
Configurer la sécurité du lac de données en utilisant le contrôle d'accès basé sur les rôles (RBAC) et la liste de contrôle d'accès

05. Explorer, transformer et charger des données dans l'entrepôt de données avec Apache Spark

Comprendre l'ingénierie du big data avec Apache Spark dans Azure Synapse Analytics
Ingérer des données avec Apache Spark notebooks dans Azure Synapse Analytics
Transformer les données avec DataFrames dans les pools Apache Spark dans Azure Synapse Analytics
Intégrer des pools SQL et Apache Spark dans Azure Synapse Analytics
Lab 5 : Explorer, transformer et charger des données dans l'entrepôt de données à l'aide d'Apache Spark
Exploration des données dans Synapse Studio
Ingérer des données avec les notebooks Spark dans Azure Synapse Analytics
Transformer des données avec des DataFrames dans des pools Spark dans Azure Synapse Analytics
Intégrer des pools SQL et Spark dans Azure Synapse Analytics

06. Explorer et transformer des données dans Azure Databricks

Décrire Azure Databricks
Lire et écrire des données dans Azure Databricks
Travailler avec des DataFrames dans Azure Databricks
Utiliser les méthodes avancées des DataFrames dans Azure Databricks
Lab 6 : exploration et transformation des données dans Azure Databricks
Les DataFrames dans Azure Databricks pour explorer et filtrer les données.
Mettre en cache un DataFrame pour accélérer les requêtes ultérieures
Supprimer des données dupliquées
Manipuler des valeurs de date et d'heure
Supprimer et renommer des colonnes de DataFrame
Agréger des données stockées dans un DataFrame

07. Ingérer et charger des données dans l'entrepôt de données

Utiliser les meilleures pratiques de chargement de données dans Azure Synapse Analytics
Ingérer à l'échelle du pétaoctet avec Azure Data Factory
Lab 7 : ingérer et charger des données dans l'entrepôt de données
Effectuez une ingestion à l'échelle du pétaoctet avec Azure Synapse Pipelines
Importer des données avec PolyBase et COPY à l'aide de T-SQL
Utiliser les meilleures pratiques de r données dans Azure Synapse Analytics

08. Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines

Intégrer des données avec Azure Data Factory ou Azure Synapse Pipelines
Transformer sans code à l'échelle avec Azure Data Factory ou Azure Synapse Pipelines
Lab 8 : transformation de données avec Azure Data Factory ou Azure Synapse Pipelines
Exécution de transformations sans code à l'échelle avec Azure Synapse Pipelines
Créer un pipeline de données pour importer des fichiers CSV mal formatés
Créer des flux de données mappés

09. Orchestrer le mouvement et la transformation des données dans Azure Synapse Pipelines

Orchestrer le mouvement et la transformation des données dans Azure Data Factory
Lab 9 : orchestrer le mouvement et la transformation des données dans Azure Synapse Pipelines
Intégrer les données des Notebooks avec Azure Data Factory ou Azure Synapse Pipelines

10. Optimiser les performances des requêtes avec des pools SQL dédiés dans Azure Synapse

Optimiser les performances des requêtes de l'entrepôt de données dans Azure Synapse Analytics
Comprendre les fonctions de développement d'entrepôt de données d'Azure Synapse Analytics
Lab 10 : Optimisation des performances des requêtes avec des pools SQL dédiés dans Azure Synapse
Comprendre les fonctionnalités de développement d'Azure Synapse Analytics
Optimiser les performances des requêtes de l'entrepôt de données dans Azure Synapse Analytics
Améliorer les performances des requêtes

11. Analyser et optimiser le stockage de l'entrepôt de données

Analyser et optimiser le stockage de l'entrepôt de données dans Azure Synapse Analytics.
Lab 11 : analyse et optimisation du stockage de l'entrepôt de données
Vérifier si les données et l'utilisation de l'espace sont asymétriques
Comprendre les détails du stockage en colonnes
Étudier l'impact des vues matérialisées
Explorer les règles pour les opérations à journalisation minimale

12. Prendre en charge le traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link

Concevoir un traitement transactionnel et analytique hybride à l'aide d'Azure Synapse Analytics
Configurer Azure Synapse Link avec Azure Cosmos DB
Interroger Azure Cosmos DB avec des pools Apache Spark
Interroger Azure Cosmos DB avec des pools SQL sans serveur
Lab 12 : prise en charge du traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link
Configuration d'Azure Synapse Link avec Azure Cosmos DB
Interroger Azure Cosmos DB avec Apache Spark pour Synapse Analytics
Interroger Azure Cosmos DB avec un pool SQL sans serveur pour Azure Synapse Analytics

13. Maîtriser la sécurité de bout en bout avec Azure Synapse Analytic

Sécurisation d'un entrepôt de données dans Azure Synapse Analytics
Configuration et gestion des secrets dans Azure Key Vault
Mise en œuvre de contrôles de conformité pour les données sensibles
Lab 13 : sécurité de bout en bout avec Azure Synapse Analytics
Sécurisation de l'infrastructure de support d'Azure Synapse Analytics
Sécurisation de l'espace de travail et des services gérés Azure Synapse Analytics
Sécurisation des données de l'espace de travail Azure Synapse Analytics

14. Traiter des flux en temps réel avec Stream Analytics

Activation d'une messagerie fiable pour les applications Big Data à l'aide d'Azure Event Hubs
Travailler avec des flux de données à l'aide d'Azure Stream Analytics
Ingérer des flux de données avec Azure Stream Analytics
Lab 14 : traitement de flux en temps réel avec Stream Analytics
Utiliser Stream Analytics pour traiter les données en temps réel provenant des Event Hubs
Utiliser les fonctions de fenêtrage de Stream Analytics pour créer des agrégats et les transmettre à Synapse Analytics
Faites évoluer le job Azure Stream Analytics pour augmenter le débit grâce au partitionnement
Repartitionner l'entrée du flux pour optimiser la parallélisation

15. Créer une solution de traitement de flux avec Event Hubs et Azure Databricks

Traitement des données en continu avec le streaming structuré d'Azure Databricks
Lab 15 : Créer une solution de traitement de flux avec Event Hubs et Azure Databricks
Explorer les principales caractéristiques et utilisations du streaming structuré
Streamer des données à partir d'un fichier et les écrire sur un système de fichiers distribué
Utiliser des fenêtres glissantes pour agréger des morceaux de données plutôt que toutes les données
Appliquer le filigrane pour supprimer les données périmées
Connexion aux flux de lecture et d'écriture des Event Hubs

16. Créer des rapports en utilisant l'intégration de Power BI avec Azure Synpase Analytics

Créer des rapports avec Power BI en utilisant son intégration avec Azure Synapse Analytics
Lab 16 : Créer des rapports à l'aide de l'intégration de Power BI avec Azure Synpase Analytics
Intégrer un espace de travail Azure Synapse et Power BI
Optimiser l'intégration avec Power BI
Améliorer les performances des requêtes avec les vues matérialisées et la mise en cache des ensembles de résultats
Visualisation des données avec SQL serverless et création d'un rapport Power BI

17. Exécuter des processus d'apprentissage automatique intégrés dans Azure Synapse Analytics

Utiliser le processus d'apprentissage automatique intégré dans Azure Synapse Analytics
Lab 17 : exécution de processus d'apprentissage automatique intégré dans Azure Synapse Analytics
Créer un service lié à Azure Machine Learning
Déclencher une expérience Auto ML à l'aide de données provenant d'une table Spark
Enrichir les données à l'aide de modèles formés
Afficher les résultats de prédiction à l'aide de Power BI

Le contenu de ce programme pourra être ajusté en fonction des niveaux et besoins des participants.

Formation microsoft azure - ingénierie des données

Objectifs de la formation :

Public :

Accessibilité de la formation :

Prérequis :

Délai d'accès :

Profil formateur :

Description
du programme

Méthodes
pédagogiques

Ressources
pédagogiques

évaluation
et sanction de fin
de parcours

Certifications
optionnelles et
en supplément

Vos avis
sur la
formation

Vos référents

Autres
formations
pouvant
vous
interesser
ou récemment
consultées...

Formation microsoft azure - ingénierie des données

Objectifs de la formation :

Public :

Accessibilité de la formation :

Prérequis :

Délai d'accès :

Profil formateur :

Description du programme

Méthodespédagogiques

Ressourcespédagogiques

évaluationet sanction de finde parcours

Certificationsoptionnelles eten supplément

Vos avissur laformation

Vos référents

Autresformationspouvantvousinteresserou récemment consultées...

Description
du programme

Méthodes
pédagogiques

Ressources
pédagogiques

évaluation
et sanction de fin
de parcours

Certifications
optionnelles et
en supplément

Vos avis
sur la
formation

Autres
formations
pouvant
vous
interesser
ou récemment
consultées...