R : INITIATION ET ANALYSES STATISTIQUES

Formation certifiante - Code CPF 93 835 - 4 jours (28 heures)

Formations en présentiel

Formations Blended - Learning

Formations E-learning Tutoré

Présentiel

Blended - Learning

E-learning tutoré

Accueil  >  Les métiers du numérique  >   Big Data  >  R : Initiation et Analyses statistiques

A l'issue de la formation, les stagiaires seront capables de :

  • Installer l’environnement d’analyse R
  • Utiliser la console de R, et les environnements de travail Tinn-R et R Studio
  • Créer et regrouper plusieurs types d’objets de R
  • Créer des programmes d’analyse avec R
  • Élaborer des graphiques avec R
  • Utiliser les packages de R pour mettre en oeuvre des modélisations statistiques (régression, ACP..)

La formation R : Initiation et Analyses statistiques est accessible à toute personne ayant des connaissances de base en statistiques (régressions, analyse en composantes principales, classification)  et en programmation.

Des exercices, des études de cas, des QCM et des tours de table permettent au formateur d’évaluer l’atteinte des objectifs ainsi que la progression du stagiaire à différents moments de la formation.
La validation de toutes les compétences requises est obligatoire pour l’obtention d’un BADGE ou d’un Certificat. L'obtention du Certificat est validé par la réalisation et la présentation d'un projet devant un jury.

  • Data Scientist / Data Miner
  • Débutant en R
  • Statisticien
  • Marketer spécialiste de la data
  • Utilisateur de bases de données intéressé par l’analyse
  • Responsable système d’informations
  • Développeurs informatiques, ingénieurs d’études
  • Architecte système et logiciel
  • Data scientist (analyse de données) ou Data miner (fouilleur des données)

PROGRAMME DE FORMATION

R : INITIATION ET ANALYSES STATISTIQUES

INTRODUCTION

  • Histoire de R
  • R et l’analyse statique
  • Avantages et inconvénients

NOTIONS DE PROGRAMMATION R

  • Utilisation de la console R
  • Apprendre l’environnement
  • Rédaction et exécution de scripts
  • Programmation orientée objet
  • Les objets de type vecteurs, matrix, array, factor, data.frame, list.
  • Manipulation des objets, classe d’objet, fonctions spécifiques, jointure.
  • Sauvegarde, suppression de mémoire.
  • Notions de boucle (for et while), condition (if), switch.
  • Calculs véctorisés
  • Frameworks , Paquets de données
  • Conditions et comparaisons
  • Formules
  • Structures conditionnelles
  • Vectorisation
  • Expressions régulières
  • R Markdown : les rapports automatisés

Atelier Pratique

MANIPULATION DE DONNEES

  • Visualiser ses données
  • Recodage de variables
  • Manipuler les données avec dplyr
  • Manipulations avancées avec data.table
  • Tris
  • Sous-ensembles
  • Fusion de tables
  • Gestion des dates
  • Fonctions à fenêtre
  • Manipuler du texte avec stringr
  • Réorganiser ses données avec tidyr
  • Scraping

EXPORTATION

  • Export de données
  • Export de graphiques

MANIPULATION DES DATES EN R

  • Date et DateTime en R
  • Formatage des dates pour la modélisation

FLUX DE CONTRÔLE

Flux de contrôle

Atelier Pratique

Analyse et statistiques avec R

STATISTIQUES INTRODUCTIVES

  • Statistique univariée
  • Statistique bivariée
  • Introduction à ggplot2, la grammaire des graphiques
  • Graphiques univariés et bivariés avec ggplot2
  • Données pondérées

STATISTIQUES INTERMÉDIAIRES

  • Intervalles de confiance
  • Comparaisons (moyennes et proportions)
  • Définir un plan d’échantillonnage complexe
  • Régression linéaire
  • Régression logistique binaire, multinomiale et ordinale
  • Analyse des correspondances multiples (ACM)
  • Classification ascendante hiérarchique (CAH)

STATISTIQUES AVANCÉES

  • Effets d’interaction dans un modèle
  • Introduction à l’analyse d’enquêtes avec R et RStudio
  • Approfondir Multicolinéarité dans la régression .
  • Analyse de survie .
  • Analyse de séquences
  • Trajectoires de soins : un exemple de données longitudinales
  • Analyse de réseaux
  • Analyse spatiale

FONDAMENTAUX DE L’ANALYSE DE DONNÉES

  • Présentation de la notion de package (librairie).
  • Cas de la régression non linéaire multiple.
  • Cas de l’analyse en composantes principales ACP.
  • Cas de la classification CAH. 

FONCTIONS EN PROFONDEUR

  • Paramètres
  • Valeurs de retour
  • Portée variable
  • Gestion des exceptions.

Atelier Pratique

APPLICATION DE FONCTIONS A TRAVERS LES DIMENSIONS

  • Sapply
  • Lapply
  • apply

ANALYSE DES DONNÉES EXPLORATOIRES (STATISTIQUES DESCRIPTIVES)

  • Données continues
  • Données catégorisées
  • Groupe par calcul avec dplyr
  • Mélange et casting de données.

STATISTIQUES DÉDUCTIVES

  • Corrélation bivariée
  • T-test et équivalents non paramétriques
  • Test Chi-quadrillé

GRAPHIQUES DE BASE

  • Système graphique de base en R
  • Scatterplots, histogrammes, barcharts, …
  • Étiquettes, légendes, titres, axes
  • Exportation de graphiques vers différents formats

GRAPHIQUES R AVANCÉS : GGPLOT2

  • ggplot2 et la grammaire des graphiques
  • Emplacements rapides (fonction qplot)
  • Construction de graphiques par pièces (fonction ggplot).
  • ggplot2 et la grammaire des graphiques
  • Étendre ggplot2
  • Combiner plusieurs graphiques
  • Graphiques interactifs
  • lattice : graphiques et formules
  • Cartes

RÉGRESSION LINÉAIRE GÉNÉRALE

  • Modèles linéaires et logistiques
  • Points de régression
  • Confusion / interaction en régression
  • Marquer de nouvelles données à partir de modèles (prédiction)

Atelier Pratique

Allez plus loin

Développez vos compétences

Financement avec le CPF via

le site MonCompteFormation

POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS