Skip to main content

UMontrealX: Fondamentaux de la science des données

Comment tirer profit des milliards de données générées par les activités humaines sans s’y perdre? Inscrivez-vous au MOOC Science des données pour découvrir les concepts fondamentaux qui sont au cœur de l’intelligence artificielle!

Fondamentaux de la science des données
8 weeks
3–4 hours per week
Self-paced
Progress at your own speed
Free
Optional upgrade available

There is one session available:

After a course session ends, it will be archivedOpens in a new tab.
Starts May 1

About this course

Skip About this course

Les données sont omniprésentes dans nos vies modernes, et leur quantité est faramineuse. Elles peuvent nous être très utiles dans tous les domaines de l’activité humaine comme la santé, le commerce et l’environnement, pour n’en nommer que quelques-uns. Mais comment tirer profit de ces données sans s’y perdre? Le cours Science des données présente les concepts essentiels permettant de collecter les données, de les traiter statistiquement, de les vérifier, de les visualiser, de les structurer et de les analyser. Nous allons décrire certains algorithmes d'apprentissage automatique, et leurs applications aux données.

Ce cours s'adresse principalement aux professionnels du secteur et aux universitaires ayant des connaissances de base en mathématiques et en programmation (idéalement Python). Les étudiants diplômés en sciences et en ingénierie (principalement ceux qui ne sont pas encore familiarisés avec la science des données) peuvent trouver ce contenu instructif et convaincant. Le contenu de ce cours sera également d’une grande utilité pour quiconque utilise ou s’intéresse à la science des données, de quelque manière que ce soit.

Nous estimons qu’il faut environ 8 semaines pour suivre ce cours. Celui-ci est divisé en segments pertinents que vous pouvez regarder à votre propre rythme. Des quiz récapitulatifs sont prévus à la fin de chaque segment pour évaluer votre compréhension du contenu. Vous pourrez également mettre la main à la pâte en réalisant des exercices pratiques qui vous permettront de vous familiariser avec les principaux savoir-faire issus de la science des données.

Ce cours a été développé par des experts du domaine du département d’informatique et de recherche opérationnelle (DIRO) de l’université de Montréal.

L’Université de Montréal rayonne depuis de nombreuses années par la qualité de son enseignement et la diversité de son offre, ce qui en fait une des meilleures universités francophones au monde. Que vous choisissiez ce cours à titre personnel ou dans une perspective de carrière en science, le point de départ est ici. La matière parcourue vous permettra de vous préparer avant de commencer un programme d’études en science des données ou toute autre étude liée à ce domaine.

Nous vous souhaitons la bienvenue dans ce cours en sciences des données, une des pierres angulaires de l'intelligence artificielle.

Course created with support from

Université de MontréalDiroPIA Pôle montréalais d'enseignement supérieur en IA

At a glance

  • Institution: UMontrealX
  • Subject: Science
  • Level: Intermediate
  • Prerequisites:

    Ce cours est accessible à tous et ne nécessite pas de prérequis, mais des connaissances en mathématiques, en statistiques et en programmation seraient un atout pour aller plus loin dans votre étude.

  • Language: Français
  • Video Transcript: Français

What you'll learn

Skip What you'll learn

À la fin de ce cours, vous serez en mesure de :

  • D’expliquer les concepts essentiels de la science des données
  • D’appliquer les méthodes mathématiques et statistiques utilisées en science des données

Module 1 – Introduction et vulgarisation

  • Introduction
  • Survol des principaux thèmes
  • Formation pratique 1 : Introduction à la syntaxe en Python

Module 2 – Méthodologie

  • Introduction
  • Méthodologie
  • Formation pratique 2 : Manipulation, analyse et gestion de données

Module 3 – Les données structurées

  • Introduction
  • Données structurées
  • Préparation et nettoyage
  • Formation pratique 3 : Visualisation de données

Module 4 – Probabilités et statistiques

  • Introduction
  • Rappel des probabilités
  • Distributions
  • Probabilités et statistiques
  • Formation pratique 4 : Analyse et traitement d’un jeu de données

Module 5 – Inférence probabiliste

  • Introduction
  • Probabilités conditionnelles
  • Réseaux bayésiens

Module 6 – Prédiction

  • Notions d’apprentissage automatique
  • Les techniques de prédiction
  • Formation pratique 6 : k-NN, sklearn et arbres de décision

Module 7 – Évaluation et sélection de modèles

  • Introduction Sur-apprentissage et sous-apprentissage
  • Évaluation du modèle
  • Méthodes d’ensemble
  • Conclusion
  • Formation pratique 7 : Régression, biais et variance

Module 8 – Partitionnement des données

  • Qu’est-ce que le partitionnement des données?
  • Les techniques
  • Indices de qualité de partitionnement
  • Formation pratique 8 : Partitionnement, K-moyennes, GMM, DBSCAN

Module 9 – Réduction de dimensionnalité

  • Qu’est-ce que la réduction de dimensionnalité?
  • Les techniques
  • Conclusion
  • Formation pratique 9 : Réduction de dimensionnalité

Projet intégrateur : Confidentialité différentielle

Interested in this course for your business or team?

Train your employees in the most in-demand topics, with edX For Business.