PYTHON POUR LA DATA SCIENCE
Formation certifiante - Code CPF 93 835 - 2 jours (14 heures)
Formations en présentiel
Formations Blended - Learning
Formations E-learning Tutoré
Présentiel
Blended - Learning
E-learning tutoré
OBJECTIFS
A l'issue de la formation, les stagiaires seront capables de :
- Connaître les notions de base de la data science
- Comprendre le rôle de Python dans la science des données,
- Maîtriser les opérations de base
- Savoir faire la la collecte, la manipulation et la visualisation de différents types de données
- Connaître les notions du Machine Learning et du deep learning
- Connaître outils et des bibliothèques dédiés comme NumPy, Pandas, Matplotlib et TensorFlow
PREREQUIS
La formation Python pour la Data Science est accessible à toute personne ayant des connaissances :
- En algorithmique
- En un langage de programmation structuré (C, VB, Java…)
MODALITE D'EVALUATION
Des exercices, des études de cas, des QCM et des tours de table permettent au formateur d’évaluer l’atteinte des objectifs ainsi que la progression du stagiaire à différents moments de la formation.
La validation de toutes les compétences requises est obligatoire pour l’obtention d’un BADGE ou d’un Certificat. L'obtention du Certificat est validé par la réalisation et la présentation d'un projet devant un jury.
PUBLIC
- Directeurs/chefs de projet ou responsable métier
- Responsable système d’informations
- Développeurs informatiques
- Consultants en business intelligence
- Ingénieurs d’étude, de recherche et développement
- Architecte système et logiciel
- Consultants techniques
- Consultants business
- Statisticiens et Mathématiciens
- Data scientist (analyse de données) ou Data miner (fouilleur des données)
- Tout développeur ou informaticien souhaitant développer des compétences en analyse de données et BIG DATA
PROGRAMME DE FORMATION
PYTHON POUR LA DATA SCIENCE
Introduction au langage Python
- Python pour la data science
- Comprendre l’importance de la data science
- Expliquer le choix de Python
- Installation de Python
Opérations basiques avec Python
- Opérations basiques sur les listes
- Opérations avancées sur les listes
- Les dictionnaires
- Les compréhensions
Chargement et préparation des données
- Intérêt du prétraitement de données
- Chargement des fichiers Excel et CSV
- Chargement d’un fichier JSON
- Interrogation d’une base de données SQL Server
- Concaténation de différentes sources de données
- Fusion de différentes sources de données
- Manipulation des données manquantes
- Maîtrise des statistiques descriptives avec NumPy
- Maîtrise des statistiques descriptives avec Pandas
Manipulation des données
- Différents types de données
- Manipulation des données quantitatives avec NumPy
- Techniques d’encodage
- Manipulation des données textuelles avec Pandas
- Manipulation des données textuelles avec NLTK
- Utilisation des séries temporelles
- Manipulation des images
Atelier pratique
Visualisation des données
- Découvrir les bases de la visualisation de données
- Matplotlib
- Seaborn
- Bokeh
- Aller plus loin avec Matplotlib
Initiation au Web scrapig
- Web scraping
- Exploration d’un document HTML avec Beautiful Soup
- Objets Tag et NavigableString
- Aller plus loin avec le web scraping
- Pratique du web scraping
Initiation aux algorithmes de machine learning
- Régression linéaire
- Mise en œuvre la régression linéaire
- Algorithme SVM
- Utilisation de l’algorithme SVM
- Classification naïve bayésienne
- Pratique de la classification naïve bayésienne
- Algorithme des k-moyennes
- Utilisation de l’algorithme des k-moyennes
- Analyse en composante principale PCA
Deep learning avec Keras et TensorFlow
- Définition du Deep learning
- Concepts du deep learning
- TensorFlow
- Keras
- Compréhension et préparation des données
- Déploiement du modèle
Atelier Pratique

Allez plus loin
Développez vos compétences
Financement avec le CPF via
le site MonCompteFormation

POUR TOUTE DEMANDE DE RENSEIGNEMENT OU DE DEVIS