• pour les personnes
  • pour les affaires
  • pour les universités
  • pour les gouvernements
Coursera
Diplômes en ligne
Carrières
Connexion
Inscrivez-vous gratuitement
Coursera
Microsoft
Effectuer de la science des données avec Azure Databricks
  • À propos
  • Résultats
  • Modules
  • Recommandations
  • Témoignages
  • Avis
  1. Parcourir
  2. Informatique
  3. Développement de logiciels

Découvrez de nouvelles compétences avec 30 % de réduction sur les cours dispensés par des experts du secteur. Économisez maintenant.

Microsoft

Effectuer de la science des données avec Azure Databricks

Ce cours fait partie de Préparation à l'examen Microsoft Azure Data Scientist Associate (DP-100) Certificat Professionnel

 Microsoft

Instructeur : Microsoft

10 846 déjà inscrits

Inclus avec Coursera Plus

•

En savoir plus

6 modules
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
3.2

(74 avis)

niveau Intermédiaire

Expérience recommandée

Expérience recommandée

Niveau intermédiaire

Expérience de l'utilisation de Python pour explorer les données et former des modèles d'apprentissage automatique avec des frameworks open-source, tels que Scikit-Learn, PyTorch, et TensorFlow.

3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

6 modules
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
3.2

(74 avis)

niveau Intermédiaire

Expérience recommandée

Expérience recommandée

Niveau intermédiaire

Expérience de l'utilisation de Python pour explorer les données et former des modèles d'apprentissage automatique avec des frameworks open-source, tels que Scikit-Learn, PyTorch, et TensorFlow.

3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
  • À propos
  • Résultats
  • Modules
  • Recommandations
  • Témoignages
  • Avis

Ce que vous apprendrez

  • Exploitez la puissance d'Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail de science des données.

  • Effectuez de l'apprentissage automatique avec Azure Databricks. Travailler avec des fonctions définies par l'utilisateur (UDF) dans Azure Databricks

  • Travaillez avec des DataFrames dans Azure Databricks. Utilisez Azure Databricks et le notebook Apache Spark pour traiter de grandes quantités de données

  • Construire et interroger un lac Delta

Compétences que vous acquerrez

  • Catégorie : Scikit-learn (Bibliothèque d'Apprentissage automatique)
    Scikit-learn (Bibliothèque d'Apprentissage automatique)
  • Catégorie : Deep learning
    Deep learning
  • Catégorie : MLOps (Apprentissage automatique)
    MLOps (Apprentissage automatique)
  • Catégorie : Big Data
    Big Data
  • Catégorie : Informatique distribuée
    Informatique distribuée
  • Catégorie : PySpark
    PySpark
  • Catégorie : Analyse exploratoire des données (AED)
    Analyse exploratoire des données (AED)
  • Catégorie : Traitement des données
    Traitement des données
  • Catégorie : Bases de données
    Bases de données
  • Catégorie : Apprentissage automatique
    Apprentissage automatique
  • Catégorie : Transformation de données
    Transformation de données
  • Catégorie : Microsoft Azure
    Microsoft Azure
  • Catégorie : Apache Spark
    Apache Spark

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

1 quiz, 30 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires
 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise en Développement de logiciels

Ce cours fait partie de la Préparation à l'examen Microsoft Azure Data Scientist Associate (DP-100) Certificat Professionnel
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable auprès de Microsoft

Il y a 6 modules dans ce cours

Dans ce cours, vous apprendrez à exploiter la puissance d'Apache Spark et des clusters puissants fonctionnant sur la plateforme Azure Databricks pour exécuter des charges de travail de science des données dans le nuage. Il s'agit du quatrième cours d'un programme de cinq cours qui vous prépare à passer l'examen de certification DP-100, Conception et mise en œuvre d'une solution de science des données sur Azure : L'examen de certification est l'occasion de prouver vos connaissances et votre expertise dans l'exploitation de solutions d'apprentissage automatique à l'échelle du nuage à l'aide d'Azure Machine Learning. Cette spécialisation vous apprend à tirer parti de vos connaissances existantes en Python et en apprentissage automatique pour gérer l'ingestion et la préparation des données, l'entraînement et le déploiement des modèles, ainsi que la surveillance des solutions d'apprentissage automatique dans Microsoft Azure. Chaque cours vous enseigne les concepts et les compétences qui sont mesurés par l'examen.

Cette Specializations est destinée aux data scientists ayant une connaissance existante de Python et des frameworks d'apprentissage automatique comme Scikit-Learn, PyTorch et Tensorflow, qui souhaitent construire et exploiter des solutions d'apprentissage automatique dans le cloud. Il enseigne aux scientifiques des données comment créer des solutions de bout en bout dans Microsoft Azure. Les étudiants apprendront à gérer les ressources Azure pour l'apprentissage automatique, à exécuter des expériences et à former des modèles, à déployer et à rendre opérationnelles des solutions d'apprentissage automatique et à mettre en œuvre un apprentissage automatique responsable. Ils apprendront également à utiliser Azure Databricks pour explorer, préparer et modéliser les données, et à intégrer les processus d'apprentissage automatique de Databricks à Azure Machine Learning.

Dans ce module, vous découvrirez les capacités d'Azure Databricks et du notebook Apache Spark pour le traitement de fichiers volumineux. Vous comprendrez la plateforme Azure Databricks et identifierez les types de tâches qui conviennent à Apache Spark. Vous serez également initié à l'architecture d'un Azure Databricks Spark Cluster et des Spark Jobs.

Inclus

7 vidéos5 lectures1 quiz3 devoirs1 sujet de discussion

7 vidéos•Total 20 minutes
  • Introduction au cours•2 minutes
  • Expliquez Azure Databricks•5 minutes
  • Résumé de la leçon•1 minute
  • Introduction à la leçon•1 minute
  • Comprendre l'architecture du cluster Spark d'Azure Databricks•4 minutes
  • Comprendre l'architecture de spark job•3 minutes
  • Résumé de la leçon•1 minute
5 lectures•Total 72 minutes
  • Plan du cours•30 minutes
  • Comment réussir ce cours ?•5 minutes
  • Créer un espace de travail et un cluster Azure Databricks•4 minutes
  • Créer et exécuter un carnet de notes•3 minutes
  • Exercice : Travailler avec des carnets•30 minutes
1 quiz•Total 18 minutes
  • Contrôle des connaissances•18 minutes
3 devoirs•Total 50 minutes
  • Préparation aux tests•30 minutes
  • Exercice quiz•2 minutes
  • Contrôle des connaissances•18 minutes
1 sujet de discussion•Total 30 minutes
  • Rencontre et accueil•30 minutes

Azure Databricks prend en charge les fonctions quotidiennes de traitement des données, telles que les lectures, les écritures et les requêtes. Dans ce module, vous travaillerez avec de grandes quantités de données provenant de sources multiples dans différents formats bruts. Vous apprendrez également à utiliser la classe de colonne DataFrame Azure Databricks pour appliquer des transformations au niveau des colonnes, telles que des tris, des filtres et des agrégations. Vous utiliserez également les opérations avancées des fonctions DataFrame pour manipuler les données, appliquer des agrégats et effectuer des opérations sur la date et l'heure dans Azure Databricks.

Inclus

4 vidéos10 lectures4 devoirs

4 vidéos•Total 5 minutes
  • Introduction à la leçon•1 minute
  • Résumé de la leçon•1 minute
  • Introduction à la leçon•1 minute
  • Résumé de la leçon•1 minute
10 lectures•Total 280 minutes
  • Lire les données au format CSV•10 minutes
  • Lire les données au format JSON•30 minutes
  • Lire les données au format Parquet•30 minutes
  • Lire les données stockées dans les tables et les vues•30 minutes
  • Données d'écriture•30 minutes
  • Exercices : Lire et écrire des données•30 minutes
  • Décrire un DataFrame•30 minutes
  • Utiliser les méthodes courantes des DataFrame•30 minutes
  • Utiliser la fonction d'affichage•30 minutes
  • Exercice : Articles distincts•30 minutes
4 devoirs•Total 62 minutes
  • Préparation aux tests•30 minutes
  • Exercice quiz•2 minutes
  • Contrôle des connaissances•12 minutes
  • Contrôle des connaissances•18 minutes

Azure Databricks prend en charge une gamme de fonctions SQL intégrées, mais vous devez parfois écrire une fonction personnalisée, connue sous le nom de User-Defined Function (UDF). Dans ce module, vous apprendrez à enregistrer et à invoquer des UDF. Vous apprendrez également à utiliser Delta Lake pour créer, ajouter et réinsérer des données dans des tables Apache Spark, en tirant parti de la fiabilité et des optimisations intégrées.

Inclus

4 vidéos7 lectures6 devoirs

4 vidéos•Total 11 minutes
  • Décrivez le lac Delta open source•7 minutes
  • Résumé de la leçon•1 minute
  • Introduction à la leçon•1 minute
  • Résumé de la leçon•1 minute
7 lectures•Total 165 minutes
  • Démarrez avec Delta en utilisant les API Spark•30 minutes
  • Exercice : Travaillez avec les fonctionnalités de base du lac Delta•30 minutes
  • Décrivez comment Azure Databricks gère Delta Lake•30 minutes
  • Exercice : Utilisez la machine à voyager dans le temps du lac Delta et effectuez une optimisation•30 minutes
  • Écrire des fonctions définies par l'utilisateur•10 minutes
  • Exercice : Effectuez des opérations d'extraction, de transformation et de chargement (ETL) à l'aide de fonctions définies par l'utilisateur•30 minutes
  • Ressources complémentaires•5 minutes
6 devoirs•Total 60 minutes
  • Préparation aux tests•21 minutes
  • Exercice quiz•2 minutes
  • Exercice quiz•2 minutes
  • Contrôle des connaissances•18 minutes
  • Exercice quiz•2 minutes
  • Contrôle des connaissances•15 minutes

Dans ce module, vous apprendrez à utiliser le package d'apprentissage automatique de PySpark pour construire les composants clés des flux de travail d'apprentissage automatique qui comprennent l'analyse exploratoire des données, l'entraînement des modèles et l'évaluation des modèles. Vous apprendrez également à construire des pipelines pour les tâches courantes de caractérisation des données.

Inclus

4 vidéos11 lectures8 devoirs

4 vidéos•Total 5 minutes
  • Introduction à la leçon•1 minute
  • Résumé de la leçon•1 minute
  • Introduction à la leçon•1 minute
  • Résumé de la leçon•1 minute
11 lectures•Total 220 minutes
  • Comprendre l'apprentissage automatique•15 minutes
  • Exercice : Entraînez un modèle et créez des prédictions•30 minutes
  • Comprendre les données à l'aide de l'analyse exploratoire des données•5 minutes
  • Exercice : Effectuez une analyse exploratoire des données•30 minutes
  • Décrire les flux de travail de l'apprentissage automatique•10 minutes
  • Exercice : Construisez et évaluez un modèle d'apprentissage automatique de base•30 minutes
  • Effectuer la featurisation de l'ensemble de données•20 minutes
  • Exercice : Terminez la featurisation de l'ensemble de données•30 minutes
  • Comprendre la modélisation de la régression•10 minutes
  • Exercice : Construire et interpréter un modèle de régression•30 minutes
  • Ressources complémentaires•10 minutes
8 devoirs•Total 85 minutes
  • Préparation aux tests•45 minutes
  • Exercice quiz•2 minutes
  • Exercice Quiz•2 minutes
  • Exercice quiz•2 minutes
  • Contrôle des connaissances•15 minutes
  • Exercice quiz•2 minutes
  • Exercice quiz•2 minutes
  • Contrôle des connaissances•15 minutes

Dans ce module, vous apprendrez à utiliser MLflow pour suivre les expériences d'apprentissage automatique et à utiliser les modules de la bibliothèque d'apprentissage automatique de Spark pour l'ajustement des hyperparamètres et la sélection des modèles.

Inclus

4 vidéos5 lectures5 devoirs

4 vidéos•Total 4 minutes
  • Introduction à la leçon•1 minute
  • Résumé de la leçon•0 minutes
  • Introduction à la leçon•1 minute
  • Résumé de la leçon•0 minutes
5 lectures•Total 130 minutes
  • Utilisez MLflow pour suivre les expériences, enregistrer les mesures et comparer les exécutions•30 minutes
  • Exercice : Travaillez avec MLflow pour suivre les métriques, les paramètres, les artefacts et les modèles de l'expérience•30 minutes
  • Décrire la sélection de modèles et l'ajustement des hyperparamètres•30 minutes
  • Exercice : Sélectionnez le modèle optimal en ajustant les hyperparamètres•30 minutes
  • Ressources complémentaires•10 minutes
5 devoirs•Total 79 minutes
  • Préparation aux tests•45 minutes
  • Quiz sur l'exercice•2 minutes
  • Contrôle des connaissances•15 minutes
  • Quiz sur l'exercice•2 minutes
  • Contrôle des connaissances•15 minutes

Dans ce module, vous apprendrez à utiliser le framework Horovod d'Uber ainsi que la bibliothèque Petastorm pour exécuter des tâches d'apprentissage profond distribuées sur Spark en utilisant des ensembles de données d'apprentissage au format Apache Parquet. Vous apprendrez également à utiliser MLflow et le service Azure Machine Learning pour enregistrer, empaqueter et déployer un modèle entraîné dans Azure Container Instance et Azure Kubernetes Service en tant que service web de notation.

Inclus

5 vidéos6 lectures4 devoirs1 sujet de discussion

5 vidéos•Total 6 minutes
  • Introduction à la leçon•1 minute
  • Résumé de la leçon•1 minute
  • Introduction à la leçon•1 minute
  • Résumé de la leçon•1 minute
  • Félicitations•0 minutes
6 lectures•Total 140 minutes
  • Utilisez Horovod pour entraîner un modèle d'apprentissage profond•30 minutes
  • Utilisez Petastorm pour lire les données au format Apache Parquet avec Horovod pour l'apprentissage distribué des modèles•10 minutes
  • Exercice : Travaillez avec Horovod et Petastorm pour former un modèle d'apprentissage profond•30 minutes
  • Utilisez Azure Machine Learning pour déployer des modèles de service•30 minutes
  • Ressources complémentaires•10 minutes
  • Prochaines étapes•30 minutes
4 devoirs•Total 77 minutes
  • Préparation aux tests•45 minutes
  • Quiz sur l'exercice•2 minutes
  • Contrôle des connaissances•15 minutes
  • Contrôle des connaissances•15 minutes
1 sujet de discussion•Total 30 minutes
  • Réfléchir à l'apprentissage•30 minutes

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Évaluations de l’enseignant

Évaluations de l’enseignant

Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.

2.9 (10 évaluations)
 Microsoft
Microsoft
239 Cours•1 760 018 apprenants

Offert par

Microsoft

Offert par

Microsoft

L'objectif de Microsoft est de permettre à chaque individu et à chaque organisation de la planète d'aller plus loin. Dans cette nouvelle révolution de la transformation numérique, la croissance est tirée par la technologie. Notre approche intégrée du cloud crée une plateforme inégalée pour la transformation numérique. Nous répondons aux besoins réels des clients en intégrant de manière transparente Microsoft 365, Dynamics 365, LinkedIn, GitHub, Microsoft Power Platform et Azure afin de libérer de la valeur commerciale pour toutes les organisations, des grandes entreprises aux entreprises familiales. Azure en est l'épine dorsale et le fondement.

En savoir plus sur Développement de logiciels

  • Statut : Essai gratuit
    Essai gratuit
    M

    Microsoft

    Microsoft Azure Machine Learning for Data Scientists

    Cours

  • Statut : Essai gratuit
    Essai gratuit
    M

    Microsoft

    Prepare for DP-100: Data Science on Microsoft Azure Exam

    Cours

  • Statut : Essai gratuit
    Essai gratuit
    M

    Microsoft

    Microsoft Azure Data Scientist Associate (DP-100) Exam Prep

    Certificat Professionnel

  • Statut : Essai gratuit
    Essai gratuit
    M

    Microsoft

    Build and Operate Machine Learning Solutions with Azure

    Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

3.2

74 avis

  • 5 stars

    41,89 %

  • 4 stars

    6,75 %

  • 3 stars

    10,81 %

  • 2 stars

    12,16 %

  • 1 star

    28,37 %

Affichage de 3 sur 74

A
AM
5

Révisé le 30 août 2024

This is absolutely great opportunity for all students

Voir plus d’avis
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

En savoir plus

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Découvrir les diplômes

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

En savoir plus

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours du certificat et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - à partir de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Si vous vous êtes abonné, vous bénéficiez d'une période d'essai gratuite de 7 jours pendant laquelle vous pouvez annuler votre abonnement sans pénalité. Après cette période, nous ne remboursons pas, mais vous pouvez résilier votre abonnement à tout moment. Consultez notre politique de remboursement complète.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,

Pied de page Coursera

Compétences techniques

  • ChatGPT
  • Codage
  • Informatique
  • Cybersécurité
  • DevOps
  • Piratage éthique
  • IA générative
  • Programmation Java
  • Python
  • Développement Web

Compétences analytiques

  • Intelligence artificielle
  • Big Data
  • Analyse de valeur et de rentabilité
  • analyse des données
  • Science des données
  • Modélisation financière
  • Apprentissage automatique
  • Microsoft Excel
  • microsoft power bi
  • SQL

Compétences professionnelles

  • Comptabilité
  • Marketing numérique
  • Commerce électronique
  • Finance
  • Google
  • Conception graphique
  • IBM
  • Marketing
  • Project Management
  • Le marketing appliqué aux réseaux sociaux

Ressources professionnelles

  • Certifications informatiques essentielles
  • Compétences à acquérir pour les hauts revenus
  • Comment obtenir un certificat PMP
  • Comment apprendre l'Intelligence artificielle (IA)
  • Certifications populaires en cybersécurité
  • Certifications appréciées en analyse des données
  • Que fait un analyste de données ?
  • Ressources pour le développement de carrière
  • Test d'aptitude professionnelle
  • Partagez votre histoire d'apprentissage Coursera

Coursera

  • À propos
  • Ce que nous proposons
  • Direction
  • Carrières
  • Catalogue
  • Coursera Plus
  • Certificats Professionnels
  • Certificats MasterTrack®
  • Diplômes
  • Pour l'entreprise
  • Pour les gouvernements
  • Pour le campus
  • Devenir un partenaire
  • Impact social
  • cours gratuits
  • Recommandations de crédits ECTS

Communauté

  • Étudiants
  • Partenaires
  • Testeurs bêta
  • Blog
  • Le podcast Coursera
  • Blog Tech

Plus

  • Presse
  • Investisseurs
  • Conditions
  • Confidentialité
  • Aide
  • Accessibilité
  • Contact
  • Articles
  • Répertoire
  • Filiales
  • Déclaration sur l’esclavage moderne
  • Gérer les préférences en matière de cookies
Apprendre partout
Télécharger dans l'App Store
Disponible sur Google Play
Logo Certified B Corporation
© 2025 Coursera Inc. Tous droits réservés.
  • Facebook Coursera
  • Linkedin Coursera
  • Twitter Coursera
  • YouTube Coursera
  • Instagram Coursera
  • TikTok Coursera
Coursera

S'inscrire

Profitez de votre temps libre pour apprendre auprès des meilleures universités et entreprises.

​
​
Entre 8 et 72 caractères
Votre mot de passe est masqué
​

ou

Vous utilisez déjà Coursera ?


J'accepte les Conditions d'utilisation et les Notification de confidentialité de Coursera. Vous rencontrez des difficultés pour vous connecter ? Centre d'Aide pour les Étudiants

Ce site est protégé par reCAPTCHA Enterprise et la Politique de confidentialité Google et les Termes et Conditions s'appliquent.