R : INITIATION ET ANALYSES STATISTIQUES
Formation certifiante - Code CPF 93 835 - 4 jours (28 heures)
Formations en présentiel
Formations Blended - Learning
Formations E-learning Tutoré
Présentiel
Blended - Learning
E-learning tutoré
A l'issue de la formation, les stagiaires seront capables de :
- Installer l’environnement d’analyse R
- Utiliser la console de R, et les environnements de travail Tinn-R et R Studio
- Créer et regrouper plusieurs types d’objets de R
- Créer des programmes d’analyse avec R
- Élaborer des graphiques avec R
- Utiliser les packages de R pour mettre en oeuvre des modélisations statistiques (régression, ACP..)
La formation R : Initiation et Analyses statistiques est accessible à toute personne ayant des connaissances de base en statistiques (régressions, analyse en composantes principales, classification) et en programmation.
Des exercices, des études de cas, des QCM et des tours de table permettent au formateur d’évaluer l’atteinte des objectifs ainsi que la progression du stagiaire à différents moments de la formation.
La validation de toutes les compétences requises est obligatoire pour l’obtention d’un BADGE ou d’un Certificat. L'obtention du Certificat est validé par la réalisation et la présentation d'un projet devant un jury.
- Data Scientist / Data Miner
- Débutant en R
- Statisticien
- Marketer spécialiste de la data
- Utilisateur de bases de données intéressé par l’analyse
- Responsable système d’informations
- Développeurs informatiques, ingénieurs d’études
- Architecte système et logiciel
- Data scientist (analyse de données) ou Data miner (fouilleur des données)
PROGRAMME DE FORMATION
R : INITIATION ET ANALYSES STATISTIQUES
INTRODUCTION
- Histoire de R
- R et l’analyse statique
- Avantages et inconvénients
NOTIONS DE PROGRAMMATION R
- Utilisation de la console R
- Apprendre l’environnement
- Rédaction et exécution de scripts
- Programmation orientée objet
- Les objets de type vecteurs, matrix, array, factor, data.frame, list.
- Manipulation des objets, classe d’objet, fonctions spécifiques, jointure.
- Sauvegarde, suppression de mémoire.
- Notions de boucle (for et while), condition (if), switch.
- Calculs véctorisés
- Frameworks , Paquets de données
- Conditions et comparaisons
- Formules
- Structures conditionnelles
- Vectorisation
- Expressions régulières
- R Markdown : les rapports automatisés
Atelier Pratique
MANIPULATION DE DONNEES
- Visualiser ses données
- Recodage de variables
- Manipuler les données avec dplyr
- Manipulations avancées avec data.table
- Tris
- Sous-ensembles
- Fusion de tables
- Gestion des dates
- Fonctions à fenêtre
- Manipuler du texte avec stringr
- Réorganiser ses données avec tidyr
- Scraping
EXPORTATION
- Export de données
- Export de graphiques
MANIPULATION DES DATES EN R
- Date et DateTime en R
- Formatage des dates pour la modélisation
FLUX DE CONTRÔLE
Flux de contrôle
Atelier Pratique
Analyse et statistiques avec R
STATISTIQUES INTRODUCTIVES
- Statistique univariée
- Statistique bivariée
- Introduction à ggplot2, la grammaire des graphiques
- Graphiques univariés et bivariés avec ggplot2
- Données pondérées
STATISTIQUES INTERMÉDIAIRES
- Intervalles de confiance
- Comparaisons (moyennes et proportions)
- Définir un plan d’échantillonnage complexe
- Régression linéaire
- Régression logistique binaire, multinomiale et ordinale
- Analyse des correspondances multiples (ACM)
- Classification ascendante hiérarchique (CAH)
STATISTIQUES AVANCÉES
- Effets d’interaction dans un modèle
- Introduction à l’analyse d’enquêtes avec R et RStudio
- Approfondir Multicolinéarité dans la régression .
- Analyse de survie .
- Analyse de séquences
- Trajectoires de soins : un exemple de données longitudinales
- Analyse de réseaux
- Analyse spatiale
FONDAMENTAUX DE L’ANALYSE DE DONNÉES
- Présentation de la notion de package (librairie).
- Cas de la régression non linéaire multiple.
- Cas de l’analyse en composantes principales ACP.
- Cas de la classification CAH.
FONCTIONS EN PROFONDEUR
- Paramètres
- Valeurs de retour
- Portée variable
- Gestion des exceptions.
Atelier Pratique
APPLICATION DE FONCTIONS A TRAVERS LES DIMENSIONS
- Sapply
- Lapply
- apply
ANALYSE DES DONNÉES EXPLORATOIRES (STATISTIQUES DESCRIPTIVES)
- Données continues
- Données catégorisées
- Groupe par calcul avec dplyr
- Mélange et casting de données.
STATISTIQUES DÉDUCTIVES
- Corrélation bivariée
- T-test et équivalents non paramétriques
- Test Chi-quadrillé
GRAPHIQUES DE BASE
- Système graphique de base en R
- Scatterplots, histogrammes, barcharts, …
- Étiquettes, légendes, titres, axes
- Exportation de graphiques vers différents formats
GRAPHIQUES R AVANCÉS : GGPLOT2
- ggplot2 et la grammaire des graphiques
- Emplacements rapides (fonction qplot)
- Construction de graphiques par pièces (fonction ggplot).
- ggplot2 et la grammaire des graphiques
- Étendre ggplot2
- Combiner plusieurs graphiques
- Graphiques interactifs
- lattice : graphiques et formules
- Cartes
RÉGRESSION LINÉAIRE GÉNÉRALE
- Modèles linéaires et logistiques
- Points de régression
- Confusion / interaction en régression
- Marquer de nouvelles données à partir de modèles (prédiction)
Atelier Pratique

Allez plus loin
Développez vos compétences
Financement avec le CPF via
le site MonCompteFormation

POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS