Menu

FORMATIONS / DONNEES DU SI / Big Data

BD-004  Machine Learning |  2 jours


01/. A quoi le Machine Learning peut-il servir ? Motivations par des cas d’usages

Identifier des « groupes » ayant des caractéristiques similaires : application au marketing (profils de consommateurs ou produits similaires) ; Construire des systèmes de prédiction : prédire la consommation électrique, le prix d’une action, le comportement d’un consommateur, etc… ; Reconnaissance automatique d’images et de sons ; Systèmes de recommandation : Amazon, Netflix, publicité ciblée ; Système d’aide à la décision.

02/. Le Machine Learning dans la stratégie d’entreprise

Comment et pourquoi un changement de paradigme est-il en train de s’opérer dans les processus décisionnels de l’entreprise ? Comment le Machine Learning procure-t-il un nouvel avantage compétitif pour l’entreprise ?

03/. Le Machine Learning : définition

Petite histoire des statistiques et du Machine Learning ; Raisonnement déductif et raisonnement inductif ;Adaptabilité : le Machine Learning consiste à apprendre à une machine ou un système une tâche pour laquelle il n’a pas été explicitement programmé ; Inférence : le Machine Learning est basé sur l’inférence : le système apprend à partir de données d’exemples, de règles générales ; Généralisation : le Machine Learning vise à donner des capacités de généralisation. Les systèmes doivent être capables de traiter efficacement des données nouvelles ; Les données d’entrée du Machine Learning : architecture, bases de données relationnelles, Big Data ?

04/. Corrélation, description et prédiction

Que signifie la corrélation de deux grandeurs? Quels sont les outils de mesures de corrélation ? Eviter la confusion entre corrélation et causalité ; Exploiter la corrélation pour mieux décrire des faits, des phénomènes ; Exploiter la corrélation pour prédire des résultats.

05/. La régression linéaire

La régression linéaire : un modèle historique et fondamental ; Principes, algorithmes d’entrainement. Minimisation de la fonction de coût. Résolution exacte et résolution approchée ; Application au cas monovarié. Généralisation au cas multivarié.

06/. La régression logistique

De la régression linéaire à la régression logistique : différences et similarités ; Principes et algorithmes d’entrainement.



07/. Les fonctions de coût

Pour la régression ; Pour la classification.

08/. Apprentissage supervisé

Distinguer les variables « explicatives » et les variables « cibles » ; Savoir quand utiliser l’apprentissage supervisé. Exemples d’applications.

09/. Apprentissage non supervisé

Différences entre l’apprentissage supervisé et non supervisé ; Savoir quand utiliser l’apprentissage non supervisé. Exemples d’applications.

10/. Apprentissage online

Intérêt de l’apprentissage online.

11/. Apprentissage par renforcement

Savoir développer des systèmes qui agissent intelligemment en environnement inconnu ou partiellement connu ; Exemple d’application et démonstration.

12/. Les langages et bibliothèques associés

Présentation des langages les plus utilisés par les data Scientist : Python et R ; Les bibliothèques de Machine Learning et de data service : scikit learn, theano, PyBrain, caret, Vowpal Wabbit.



Public
Chefs de projet, développeurs, data scientists, et architectes souhaitant comprendre comment organiser le traitement des données et structurer les processus de Machine Learning.

Objectifs
Préparer les données afin de les rendre exploitable dans une approche machine learning. Mettre en œuvre des algorithmes d’apprentissage automatique. Découvrir les outils de visualisation des données ainsi que des exemples concrets.  

Prérequis
De bonnes connaissances des principes du BigData, et des architectures techniques mises en œuvre sont nécessaires pour suivre cette formation.

Moyens pédagogiques
1 ordinateur et 1 support de cours par personne + 1 vidéoprojecteur. Évaluation par écrit en fin de cours et attestation de stage délivrée en fin de formation.  

VOS DATES DE FORMATION