Science des données avec Python - eLearning
450,00 EUR
- 50 hours
Le cours de Python pour la science des données couvre les concepts fondamentaux de programmation avec Python et explique l'analyse de données, l'apprentissage automatique, la visualisation de données, l'extraction de données Web et le traitement du langage naturel. Vous acquerrez une compréhension complète des différents packages et bibliothèques nécessaires pour réaliser les aspects de l'analyse de données.
Caractéristiques principales
Langue
Le cours et le matériel sont en anglais
Niveau
Niveau débutant - intermédiaire
Accès
Accès d'un an à la plateforme d'e-learning en autoformation disponible 24/7
6 heures de contenu vidéo
avec 40 heures de temps d'étude recommandé et de pratique
Pratiques
Laboratoires virtuels, Simulation de test, Projets de fin d'études
Pas d'examen
Il n'y a pas d'examen pour le cours mais l'étudiant recevra une attestation de fin de formation
Cours gratuit en bonus !
Les bases des statistiques pour la Data Science

Résultats d'apprentissage
À la fin de ce cours d'apprentissage en ligne sur la science des données avec Python, vous serez capable de :
Acquérez une compréhension approfondie des processus de science des données, de la préparation des données, de l'exploration des données, de la visualisation des données, de la construction d'hypothèses et de leur test.
Installez l'environnement Python requis ainsi que les autres outils et bibliothèques auxiliaires.
Comprenez les concepts essentiels de la programmation Python, tels que les types de données, les tuples, les listes, les opérateurs de base et les fonctions.
Effectuez des calculs mathématiques de haut niveau en utilisant le package NumPy et sa vaste bibliothèque de fonctions mathématiques.
Effectuez des calculs mathématiques de haut niveau en utilisant le package NumPy et sa vaste bibliothèque de fonctions mathématiques.
Effectuez des calculs scientifiques et techniques en utilisant le package SciPy et ses sous-packages, tels que Integrate, Optimise, Statistics, IO et Weave.
Effectuez l'analyse et la manipulation des données en utilisant les structures de données et les outils fournis dans le package Pandas.
Acquérez une expertise en apprentissage automatique en utilisant le package Scikit-Learn
Comprenez les modèles d'apprentissage supervisé et non supervisé tels que la régression linéaire, la régression logistique, le clustering, la réduction de dimensionnalité, le K-NN et le pipeline.
Utilisez le package Scikit-Learn pour le traitement du langage naturel.
Utilisez la bibliothèque matplotlib de Python pour la visualisation de données
Extraire des données précieuses des sites web en effectuant du scrapage web à l'aide de Python
Intégrez Python avec Hadoop et MapReduce
Contenu du cours

Introduction à la science des données
Leçon 01
- Science des données et ses applications
- Le processus de la science des données : Partie 1
- Le processus de la science des données : Partie 2
Notions essentielles de la programmation Python
Leçon 02
- Configuration de Jupyter Notebook
- Fonctions Python
- Types et séquences en Python
- Plongée approfondie dans les chaînes de caractères Python
- Démonstration Python : Lecture et écriture de fichiers csv
- Date et heure en Python
- Objets dans Map en Python
- Lambda et Compréhension de liste
- Pourquoi utiliser Python pour l'analyse de données ?
- Paquets Python pour la science des données
- Package StatsModels
- Paquet Scipy
NumPy
Leçon 03
- Fondamentaux de NumPy
- Formes de tableaux et axes dans NumPy : Partie A
- Formes et axes des tableaux NumPy : Partie B
- Opérations arithmétiques
- Logique conditionnelle
- Fonctions mathématiques et statistiques courantes dans Numpy
- Indexation et découpage
- Gestion des fichiers
Algèbre linéaire
Leçon 03
- Introduction à l'algèbre linéaire
- Scalaires et Vecteurs
- Produit scalaire de deux vecteurs
- Indépendance linéaire des vecteurs
- Norme d'un vecteur
- Opérations sur les matrices
- Rang d'une matrice
- Déterminant d'une matrice et matrice identité ou opérateur
- Inverse d'une matrice et Valeurs propres et Vecteurs propres
- Calcul différentiel en algèbre linéaire
Fondamentaux de la statistique
Leçon 05
- Importance de la statistique par rapport à la science des données
- Termes statistiques courants
- Types de statistiques
- Catégorisation et types de données
- Niveaux de mesure
- Mesures de tendance centrale
- Mesures de dispersion
- Variables aléatoires
- Ensembles
- Mesures de forme (Asymétrie & Kurtosis)
- Covariance et Corrélation
Distribution de probabilité
Leçon 06
- Probabilité, son importance et la distribution des probabilités
- Distribution de probabilité : Distribution binomiale
- Distribution de probabilité : Distribution de Poisson
- Distribution de probabilité : Distribution normale
- Distribution de probabilité : Distribution de Bernoulli
- Fonction de densité de probabilité et fonction de masse
- Fonction de répartition cumulative
- Théorème central limite
- Théorie de l'estimation
Statistiques avancées
Leçon 07
- Distribution
- Curtose, Asymétrie et la distribution de Student T
- Test d'hypothèse et mécanisme
- Résultats des tests d'hypothèses : erreurs de type I et II
- Hypothèse nulle et hypothèse alternative
- Intervalles de confiance
- Marges d'erreur
- Comparer et contraster le test T et le test Z
- Théorème de Bayes
- Distribution du chi-carré
- Test du Chi carré et adéquation
- Analyse de la variance ou ANOVA
- Terminologies ANOVA
- Partition de la variance en utilisant Python
- Distribution F en utilisant Python
- F - Test
Pandas
Leçon 08
- Séries Pandas
- Interroger une série
- Dataframes Pandas
- Pandas Panel
- Fonctions courantes dans Pandas
- Fonctions Pandas Données Statistiques, Fonction Fenêtres
- Fonction Pandas pour les données et les différences de temps
- Données catégorielles
- Travailler avec des données textuelles
- Itération
- Tri
- Tracer des graphiques avec Pandas
Analyse de données
Leçon 09
- Comprendre les données
- Types de données Structurées Non structurées Désordonnées etc
- Travailler avec les données Choix des outils appropriés, Collecte de données, Manipulation des données
- Importer et exporter des données en Python
- Expressions régulières en Python
- Manipulation de texte avec des expressions régulières
- Accéder aux bases de données en Python
Manipulation de données
Leçon 10
- Code Pandas charmant ou idiomatique
- Chargement de l'indexation et de la réindexation
- Fusion
- Optimisation de la mémoire en Python
- Prétraitement des données : Chargement des données et suppression des valeurs nulles
- Prétraitement des données en comblant les valeurs nulles
- Formatage et normalisation des données binaires
- Standardisation du regroupement en bacs
- Décrire les données
Visualisation des données
Leçon 11
- Principes de la visualisation de l'information
- Visualisation des données à l'aide de tableaux croisés dynamiques
- Bibliothèques de visualisation de données en Python Matplotlib
- Types de graphiques
- Bibliothèques de visualisation de données en Python : Seaborn, Plotly, Bokeh
- Utilisation de Matplotlib pour tracer des graphiques
- Tracer des graphiques 3D pour plusieurs colonnes en utilisant Matplotlib
- Utiliser Matplotlib avec d'autres packages Python
- Utiliser Seaborn pour tracer des graphiques
- Tracé de graphiques 3D pour plusieurs colonnes en utilisant Seaborn
- Introduction à Plotly et Bokeh
Les bases des statistiques pour la Data Science
Cours gratuit en bonus !
- Introduction aux statistiques
- Comprendre les données
- Statistiques descriptives
- Visualisation des données
- Probabilités
- Distributions de probabilités
- Échantillonnage et techniques d'échantillonnage
- Statistiques inférentielles
- Application des statistiques inférentielles
- Relation entre les variables
- Application des statistiques dans le commerce
- Pratique assistée
Projet du cours
Le cours inclut également des projets concrets issus du monde de l'industrie. L'évaluation positive de l'un des projets suivants fait partie des critères d'éligibilité :
Projet 1 : Analyse des ventes au détail pour la planification stratégique
Examinez les données de vente d'une entreprise de vente au détail de vêtements afin d'aider la direction à élaborer des stratégies efficaces pour la croissance des ventes et l'expansion de l'entreprise.
Projet 2 : Évaluation de l'efficacité d'une campagne marketing
Réalisez une analyse exploratoire des données et des tests d'hypothèses afin d'identifier les facteurs clés qui influencent l'acquisition de clients et le succès d'une campagne.
Projet 3 : Exploration visuelle de données immobilières
Utiliser diverses techniques de visualisation pour analyser un ensemble de données immobilières et en extraire des informations significatives.
Projet 4 : Étude des prix du marché immobilier
Étudier les données du marché immobilier afin de révéler les tendances des prix de l'immobilier, comprendre les facteurs qui influencent les prix et évaluer l'impact des différentes caractéristiques des logements sur leur valeur.
Projet 5 : Analyse des modèles de comportement des clients
Appliquer des distributions de probabilité pour étudier le comportement des clients et évaluer les performances des magasins à l'aide d'un ensemble de données personnalisé.

Qui devrait s'inscrire à ce programme ?
Ce cours est idéal pour les personnes qui sont intéressées par une carrière dans la science des données, l'apprentissage automatique ou l'intelligence artificielle, et qui cherchent à améliorer leurs compétences en programmation Python et en analyse de données.
Aspirants Data Scientists
Analystes de données
Ingénieurs logiciels ou Programmeurs
Chercheurs et universitaires
Passionnés d'apprentissage automatique
Étudiants et Diplômés
Prérequis
Les apprenants doivent posséder un diplôme de premier cycle ou un diplôme d'études secondaires. De plus, une curiosité pour l'analyse de données et une volonté d'explorer les applications de Python dans le domaine de la science des données sont vivement encouragées. Il est également recommandé de disposer de :
- Connaissances de base en programmation Python : Familiarité avec les concepts fondamentaux de la programmation Python tels que les variables, les boucles, les fonctions et le contrôle de flux.
- Compréhension élémentaire de la statistique : Une compréhension élémentaire de la statistique, incluant des concepts tels que la moyenne, la médiane, l'écart-type, la probabilité et la corrélation.
- Mathématiques : Des compétences de base en mathématiques, notamment en algèbre et en algèbre linéaire, seront utiles, en particulier lors du travail avec des algorithmes ou des modèles d'apprentissage automatique.
Foire aux questions

Besoin d'une solution d'entreprise ou d'une intégration LMS ?
Vous n'avez pas trouvé le cours ou le programme adapté à votre entreprise ? Besoin d'une intégration LMS ? Écrivez-nous ! Nous réglerons tout !