Science des données avec Python - eLearning

450,00 EUR

  • 50 hours
eLearning

Le cours de Python pour la science des données couvre les concepts fondamentaux de programmation avec Python et explique l'analyse de données, l'apprentissage automatique, la visualisation de données, l'extraction de données Web et le traitement du langage naturel. Vous acquerrez une compréhension complète des différents packages et bibliothèques nécessaires pour réaliser les aspects de l'analyse de données.

Caractéristiques principales

Langue

Le cours et le matériel sont en anglais

Niveau

Niveau débutant - intermédiaire

Accès

Accès d'un an à la plateforme d'e-learning en autoformation disponible 24/7

6 heures de contenu vidéo

avec 40 heures de temps d'étude recommandé et de pratique

Pratiques

Laboratoires virtuels, Simulation de test, Projets de fin d'études

Pas d'examen

Il n'y a pas d'examen pour le cours mais l'étudiant recevra une attestation de fin de formation

Cours gratuit en bonus !

Les bases des statistiques pour la Data Science

Hero

Résultats d'apprentissage

À la fin de ce cours d'apprentissage en ligne sur la science des données avec Python, vous serez capable de :

Acquérez une compréhension approfondie des processus de science des données, de la préparation des données, de l'exploration des données, de la visualisation des données, de la construction d'hypothèses et de leur test.

Installez l'environnement Python requis ainsi que les autres outils et bibliothèques auxiliaires.

Comprenez les concepts essentiels de la programmation Python, tels que les types de données, les tuples, les listes, les opérateurs de base et les fonctions.

Effectuez des calculs mathématiques de haut niveau en utilisant le package NumPy et sa vaste bibliothèque de fonctions mathématiques.

Effectuez des calculs mathématiques de haut niveau en utilisant le package NumPy et sa vaste bibliothèque de fonctions mathématiques.

Effectuez des calculs scientifiques et techniques en utilisant le package SciPy et ses sous-packages, tels que Integrate, Optimise, Statistics, IO et Weave.

Effectuez l'analyse et la manipulation des données en utilisant les structures de données et les outils fournis dans le package Pandas.

Acquérez une expertise en apprentissage automatique en utilisant le package Scikit-Learn

Comprenez les modèles d'apprentissage supervisé et non supervisé tels que la régression linéaire, la régression logistique, le clustering, la réduction de dimensionnalité, le K-NN et le pipeline.

Utilisez le package Scikit-Learn pour le traitement du langage naturel.

Utilisez la bibliothèque matplotlib de Python pour la visualisation de données

Extraire des données précieuses des sites web en effectuant du scrapage web à l'aide de Python

Intégrez Python avec Hadoop et MapReduce

Contenu du cours

Hero
  1. Introduction à la science des données

    Leçon 01

    • Science des données et ses applications
    • Le processus de la science des données : Partie 1
    • Le processus de la science des données : Partie 2
  2. Notions essentielles de la programmation Python

    Leçon 02

    • Configuration de Jupyter Notebook
    • Fonctions Python
    • Types et séquences en Python
    • Plongée approfondie dans les chaînes de caractères Python
    • Démonstration Python : Lecture et écriture de fichiers csv
    • Date et heure en Python
    • Objets dans Map en Python
    • Lambda et Compréhension de liste
    • Pourquoi utiliser Python pour l'analyse de données ?
    • Paquets Python pour la science des données
    • Package StatsModels
    • Paquet Scipy
  3. NumPy

    Leçon 03

    • Fondamentaux de NumPy
    • Formes de tableaux et axes dans NumPy : Partie A
    • Formes et axes des tableaux NumPy : Partie B
    • Opérations arithmétiques
    • Logique conditionnelle
    • Fonctions mathématiques et statistiques courantes dans Numpy
    • Indexation et découpage
    • Gestion des fichiers
  4. Algèbre linéaire

    Leçon 03

    • Introduction à l'algèbre linéaire
    • Scalaires et Vecteurs
    • Produit scalaire de deux vecteurs
    • Indépendance linéaire des vecteurs
    • Norme d'un vecteur
    • Opérations sur les matrices
    • Rang d'une matrice
    • Déterminant d'une matrice et matrice identité ou opérateur
    • Inverse d'une matrice et Valeurs propres et Vecteurs propres
    • Calcul différentiel en algèbre linéaire
  5. Fondamentaux de la statistique

    Leçon 05

    • Importance de la statistique par rapport à la science des données
    • Termes statistiques courants
    • Types de statistiques
    • Catégorisation et types de données
    • Niveaux de mesure
    • Mesures de tendance centrale
    • Mesures de dispersion
    • Variables aléatoires
    • Ensembles
    • Mesures de forme (Asymétrie & Kurtosis)
    • Covariance et Corrélation
  6. Distribution de probabilité

    Leçon 06

    • Probabilité, son importance et la distribution des probabilités
    • Distribution de probabilité : Distribution binomiale
    • Distribution de probabilité : Distribution de Poisson
    • Distribution de probabilité : Distribution normale
    • Distribution de probabilité : Distribution de Bernoulli
    • Fonction de densité de probabilité et fonction de masse
    • Fonction de répartition cumulative
    • Théorème central limite
    • Théorie de l'estimation
  7. Statistiques avancées

    Leçon 07

    • Distribution
    • Curtose, Asymétrie et la distribution de Student T
    • Test d'hypothèse et mécanisme
    • Résultats des tests d'hypothèses : erreurs de type I et II
    • Hypothèse nulle et hypothèse alternative
    • Intervalles de confiance
    • Marges d'erreur
    • Comparer et contraster le test T et le test Z
    • Théorème de Bayes
    • Distribution du chi-carré
    • Test du Chi carré et adéquation
    • Analyse de la variance ou ANOVA
    • Terminologies ANOVA
    • Partition de la variance en utilisant Python
    • Distribution F en utilisant Python
    • F - Test
  8. Pandas

    Leçon 08

    • Séries Pandas
    • Interroger une série
    • Dataframes Pandas
    • Pandas Panel
    • Fonctions courantes dans Pandas
    • Fonctions Pandas Données Statistiques, Fonction Fenêtres
    • Fonction Pandas pour les données et les différences de temps
    • Données catégorielles
    • Travailler avec des données textuelles
    • Itération
    • Tri
    • Tracer des graphiques avec Pandas
  9. Analyse de données

    Leçon 09

    • Comprendre les données
    • Types de données Structurées Non structurées Désordonnées etc
    • Travailler avec les données Choix des outils appropriés, Collecte de données, Manipulation des données
    • Importer et exporter des données en Python
    • Expressions régulières en Python
    • Manipulation de texte avec des expressions régulières
    • Accéder aux bases de données en Python
  10. Manipulation de données

    Leçon 10

    • Code Pandas charmant ou idiomatique
    • Chargement de l'indexation et de la réindexation
    • Fusion
    • Optimisation de la mémoire en Python
    • Prétraitement des données : Chargement des données et suppression des valeurs nulles
    • Prétraitement des données en comblant les valeurs nulles
    • Formatage et normalisation des données binaires
    • Standardisation du regroupement en bacs
    • Décrire les données
  11. Visualisation des données

    Leçon 11

    • Principes de la visualisation de l'information
    • Visualisation des données à l'aide de tableaux croisés dynamiques
    • Bibliothèques de visualisation de données en Python Matplotlib
    • Types de graphiques
    • Bibliothèques de visualisation de données en Python : Seaborn, Plotly, Bokeh
    • Utilisation de Matplotlib pour tracer des graphiques
    • Tracer des graphiques 3D pour plusieurs colonnes en utilisant Matplotlib
    • Utiliser Matplotlib avec d'autres packages Python
    • Utiliser Seaborn pour tracer des graphiques
    • Tracé de graphiques 3D pour plusieurs colonnes en utilisant Seaborn
    • Introduction à Plotly et Bokeh
  12. Les bases des statistiques pour la Data Science

    Cours gratuit en bonus !

    • Introduction aux statistiques
    • Comprendre les données
    • Statistiques descriptives
    • Visualisation des données
    • Probabilités
    • Distributions de probabilités
    • Échantillonnage et techniques d'échantillonnage
    • Statistiques inférentielles
    • Application des statistiques inférentielles
    • Relation entre les variables
    • Application des statistiques dans le commerce
    • Pratique assistée

Projet du cours

Le cours inclut également des projets concrets issus du monde de l'industrie. L'évaluation positive de l'un des projets suivants fait partie des critères d'éligibilité :

Projet 1 : Analyse des ventes au détail pour la planification stratégique

Examinez les données de vente d'une entreprise de vente au détail de vêtements afin d'aider la direction à élaborer des stratégies efficaces pour la croissance des ventes et l'expansion de l'entreprise.

Projet 2 : Évaluation de l'efficacité d'une campagne marketing

Réalisez une analyse exploratoire des données et des tests d'hypothèses afin d'identifier les facteurs clés qui influencent l'acquisition de clients et le succès d'une campagne.

Projet 3 : Exploration visuelle de données immobilières

Utiliser diverses techniques de visualisation pour analyser un ensemble de données immobilières et en extraire des informations significatives.

Projet 4 : Étude des prix du marché immobilier

Étudier les données du marché immobilier afin de révéler les tendances des prix de l'immobilier, comprendre les facteurs qui influencent les prix et évaluer l'impact des différentes caractéristiques des logements sur leur valeur.

Projet 5 : Analyse des modèles de comportement des clients

Appliquer des distributions de probabilité pour étudier le comportement des clients et évaluer les performances des magasins à l'aide d'un ensemble de données personnalisé.

data scientist avec python

Qui devrait s'inscrire à ce programme ?

Ce cours est idéal pour les personnes qui sont intéressées par une carrière dans la science des données, l'apprentissage automatique ou l'intelligence artificielle, et qui cherchent à améliorer leurs compétences en programmation Python et en analyse de données.

Aspirants Data Scientists

Analystes de données

Ingénieurs logiciels ou Programmeurs

Chercheurs et universitaires

Passionnés d'apprentissage automatique

Étudiants et Diplômés

Commencez le cours maintenant

Prérequis

Les apprenants doivent posséder un diplôme de premier cycle ou un diplôme d'études secondaires. De plus, une curiosité pour l'analyse de données et une volonté d'explorer les applications de Python dans le domaine de la science des données sont vivement encouragées. Il est également recommandé de disposer de :

  • Connaissances de base en programmation Python : Familiarité avec les concepts fondamentaux de la programmation Python tels que les variables, les boucles, les fonctions et le contrôle de flux.
  • Compréhension élémentaire de la statistique : Une compréhension élémentaire de la statistique, incluant des concepts tels que la moyenne, la médiane, l'écart-type, la probabilité et la corrélation.
  • Mathématiques : Des compétences de base en mathématiques, notamment en algèbre et en algèbre linéaire, seront utiles, en particulier lors du travail avec des algorithmes ou des modèles d'apprentissage automatique.

Foire aux questions

Besoin d'une solution d'entreprise ou d'une intégration LMS ?

Vous n'avez pas trouvé le cours ou le programme adapté à votre entreprise ? Besoin d'une intégration LMS ? Écrivez-nous ! Nous réglerons tout !