INTRODUCTION A LA DATA SCIENCE
Formation certifiante - Code CPF 93 835 - 1 jour (7 heures)
Formations en présentiel
Formations Blended - Learning
Formations E-learning Tutoré
Présentiel
Blended - Learning
E-learning tutoré
OBJECTIFS
A l'issue de la formation, les stagiaires seront capables de :
- Comprendre la data science et les opportunités pour les entreprises
- Bien positionner la data science dans la chaîne de traitement des données
- Apprendre à modéliser un problème de Data Science
- Découvrir l’intérêt des algorithmes
- Concevoir l’architecture
- Choisir les composants techniques
PREREQUIS
La formation Introduction à la Data Science est accessible à toute personne ayant :
- Un minimum de connaissances de Linux et des lignes de commandes
- Des connaissances du langage java et de son écosystème (maven, IDE)
- Des connaissance sur le réseau
- Des connaissances de ce que sont REST/HTTP
- Des connaissances du format Json, Yaml
MODALITE D'EVALUATION
Des exercices, des études de cas, des QCM et des tours de table permettent au formateur d’évaluer l’atteinte des objectifs ainsi que la progression du stagiaire à différents moments de la formation.
La validation de toutes les compétences requises est obligatoire pour l’obtention d’un BADGE ou d’un Certificat. L'obtention du Certificat est validé par la réalisation et la présentation d'un projet devant un jury.
PUBLIC
- Directeurs/chefs de projet ou responsable métier
- Responsable système d’informations
- Développeurs informatiques
- Consultants en business intelligence
- Ingénieurs d’étude, de recherche et développement
- Architecte système et logiciel
- Consultants techniques
- Consultants business
- Statisticiens et Mathématiciens
- Data scientist (analyse de données) ou Data miner (fouilleur des données)
- Tout développeur ou informaticien souhaitant développer des compétences en analyse de données et BIG DATA
PROGRAMME DE FORMATION
INTRODUCTION A LA DATA SCIENCE
Introduction à la Data Science
BIG DATA
Deep learning
- Perceptron
- Réseaux neuronaux multicouches (MLP)
- Réseaux neuronaux convolutifs (CNN)
- Réseaux neuronaux récursifs (RNN)
Machine Learning
- Apprentissage automatique supervisé/ non supervisé
- Algorithmes du Machine Learning
Principes de la data science
- Approche fonctionnelle de base
- Variables prédictives
- Variables à prédire
- Fonctions hypothèses
- Estimateurs (biais et variances)
- Compromis biais – variance
- Fonctions de perte
- Régularisation des paramètres
- Optimisation des paramètres
Clustering
- k-moyens (kMeans)
- Clustering hiérarchique
- Approche DBSCAN
Classification
- Régression logistique
- Machines à vecteurs de support (SVM)
- Arbres de décisions
- K plus proches voisins (kNN)
Traitements en Data Science
- Compressions des données
- Réglages des modèles
Principes de l’apprentissage d’ensemble
- Forêts aléatoires
- gradient boosting
Principes de la régression
- Explorations des données régressives
- Performance des modèles de régression
Atelier Cas pratique

Allez plus loin
Développez vos compétences
Financement avec le CPF via
le site MonCompteFormation

POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS