MACHINE LEARNING AVEC R
Formation certifiante - Code CPF 93 835 - 2 jours (14 heures)
Formations en présentiel
Formations Blended - Learning
Formations E-learning Tutoré
Présentiel
Blended - Learning
E-learning tutoré
A l'issue de la formation, les stagiaires seront capables de :
- Connaître les fondamentaux du Machine Learning
- Comprendre les notions liées à l’apprentissage automatique : Régression linéaire, Régression logistique, Clustering des k-mean, Classification simple et multiple, Réseaux de neurones
- Utiliser les principaux algorithmes de modélisation du Data Mining sous R
- Apprendre l’algorithme des k plus proches voisins (k Nearest Neighbors)
- Savoir mettre en place une stratégie de Machine Learning en R afin de création d’un modèle en le mesurant et en affichant les résultats, le tout en utilisant des algorithmes performants.
- Apprendre les principes de la modélisation statistique,
- Savoir choisir entre régression et classification selon la problématique
- Savoir évaluer les performances prédictives d’un modèle donné
La formation Machine Learning avec R est accessible à toute personne ayant une maîtriser de l’algorithmie, une appétence pour les mathématiques. La connaissance de R et des statistiques est un plus.
Des exercices, des études de cas, des QCM et des tours de table permettent au formateur d’évaluer l’atteinte des objectifs ainsi que la progression du stagiaire à différents moments de la formation.
La validation de toutes les compétences requises est obligatoire pour l’obtention d’un BADGE ou d’un Certificat. L'obtention du Certificat est validé par la réalisation et la présentation d'un projet devant un jury.
- Data Scientist / Data Miner
- Débutant en R
- Statisticien
- Marketer spécialiste de la data
- Utilisateur de bases de données intéressé par l’analyse
- Responsable système d’informations
- Développeurs informatiques, ingénieurs d’études
- Architecte système et logiciel
- Data scientist (analyse de données) ou Data miner (fouilleur des données)
PROGRAMME DE FORMATION
MACHINE LEARNING AVEC R
MACHINE LEARNING
- Types de données (Structurées Semi-structurées non structurées)
- Nature statistique des données (qualitatives ou quantitatives)
- Apprentissage supervisé : répéter un exemple
- Apprentissage non supervisé : découvrir les données
- Apprentissage renforcé : optimisation d’une récompense
- Autres types d’apprentissage (par transfert, séquentiel, actif…)
ALGORITHMES DU MACHINE LEARNING
- Régression linéaire simple et multiple
- Régression polynomiale
- Séries temporelles
- Régression logistique et applications en scoring
- Classification hiérarchique et non hiérarchique (KMeans)
- Classification par arbres de décision ou approche Naïve Bayes
- Random Forest (développement des arbres de décision)
- Gradiant Boosting
- Réseaux de neurones
- Machine à support de vecteurs
- Deep Learning: exemples et raisons du succès actuel
- Text Mining : analyse des corpus de données textuelles
FONDAMENTAUX DU LANGAGE R
- Les bases de R
- Les listes, Les tuples, Les dictionnaires, Les modules et packages
- Le paradigme orienté objet
- Syntaxe
- Type de données
- Import/Export de données
- Manipulation des librairies
ANALYSE EN COMPOSANTES
- Analyse en Composantes Principales
- Analyse Factorielle des Correspondances
- Analyse des Correspondances Multiple
MODELISATION
- Algorithmes supervisés et non supervisés.
- Choix entre la régression et la classification
- Construction d’un modèle
ALGORITHMES NON SUPERVISÉS
- Clustering hiérarchique
- Clustering non hiérarchique
- Approches mixte
ALGORITHMES SUPERVISÉS
- Principe de régression linéaire univariée
- Régression multivariée
- Régression polynomiale
- Régression logistique
- Naive Bayes
- Arbre de décision
- KNN
PROCÉDURES D’ÉVALUATION DE MODÈLES
- Techniques de ré-échantillonnage en jeu d’apprentissage, de validation et de test.
- Mesures de performance des modèles prédictifs
- Matrice de confusion, de coût et la courbe ROC et AUC
ANALYSE DE DONNÉES TEXTUELLES
- Packages utiles
- Cas de la régression linéaire multiple
- Cas de l’analyse en composantes principales ACP
- Cas de la classification CAH
CLASSIFICATION ET RÉGRESSION
- Règles bayésiennes naïves
- Initiation à la librairie « e1071 » de R
- Arbre de décision CART
- Initiation à la librairie « party » de R
- Arbre de décision RandomForest
- Initiation à la librairie « randomForest » de R
- Régression linéaire
- Initiation à la fonction lm() de R
CLUSTERING
- Centroid-based clustering
- Algorithme du K-means
- Fonction kmeans de R
- Hierarchical clustering
- Concepts théoriques
- Fonction hclust de R
- Density-based clustering
- Concepts théoriques
- Application dans R
OUTILS DE SUPPORT À R
- Data preprocessing avec Dataiku
- Utilisation de R dans Dataiku

Allez plus loin
Développez vos compétences
Financement avec le CPF via
le site MonCompteFormation

POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS