Ir al contenido principal

LVx: Fundamentals of Deep Reinforcement Learning

Learn the theoretical foundations of Deep Learning through practical Python code.

Fundamentals of Deep Reinforcement Learning
8 semanas
2–6 horas por semana
A tu ritmo
Avanza a tu ritmo
Este curso está archivado

Sobre este curso

Omitir Sobre este curso

This course starts from the very beginnings of Reinforcement Learning and works its way up to a complete understanding of Q-learning, one of the core reinforcement learning algorithms.

In part II of this course, you'll use neural networks to implement Q-learning to produce powerful and effective learning agents (neural nets are the "Deep" in "Deep Reinforcement Learning").

De un vistazo

  • Institución: LVx
  • Tema: Informática
  • Nivel: Introductory
  • Prerrequisitos:
    • Requirements:

      • Proficiency with Python
      • Functions, classes, objects, loops
      • Basic familiarity with Jupyter notebooks

    Recommended Prerequisites:

    • Basic probability
      • Sampling from a normal distributon
      • Conditional probability notation
      • \mathbb{E}E - expectation
    • \SigmaΣ - the summation operator
  • Idioma: English
  • Transcripción de video: English
  • Habilidades asociadas:Q Learning, Artificial Neural Networks, Reinforcement Learning, Deep Learning, Python (Programming Language)

Lo que aprenderás

Omitir Lo que aprenderás
  • The theoretical underpinnings of Reinforcement Learning ("RL").
  • How to implement each piece of theory to solve real problems in Python.
  • The core RL formula: The Bellman Equation
  • The Q-Learning algorithm, as well as many powerful improvements.
  • Enough to prepare you for implement Reinforcement Learning algorithms using Deep Neural Networks (Part II).

Each concept is presented with a video overview, and detailed Jupyter notebooks covering each aspect of theory and practice.

Plan de estudios

Omitir Plan de estudios
  • Introduction to Reinforcment Learning
  • Bandit Problems
    • Epsilon Greedy Agent
  • Markov Decision Processes
    • Episode Returns
    • Returns and Discount Factors
  • The Bellman Equation
  • Iterative Policy Evaluation and Improvement
  • Policy Evaluation and Iteration
  • Dynamic Programming
  • Q-Learning and Sampling Based Methods
  • Monte Carlo Rollouts vs. Temporal Difference Learning
  • On-Policy Learning vs. Off-Policy Learning
  • Q-Learning
  • What's Next

¿Quién puede hacer este curso?

Lamentablemente, las personas residentes en uno o más de los siguientes países o regiones no podrán registrarse para este curso: Irán, Cuba y la región de Crimea en Ucrania. Si bien edX consiguió licencias de la Oficina de Control de Activos Extranjeros de los EE. UU. (U.S. Office of Foreign Assets Control, OFAC) para ofrecer nuestros cursos a personas en estos países y regiones, las licencias que hemos recibido no son lo suficientemente amplias como para permitirnos dictar este curso en todas las ubicaciones. edX lamenta profundamente que las sanciones estadounidenses impidan que ofrezcamos todos nuestros cursos a cualquier persona, sin importar dónde viva.

¿Te interesa este curso para tu negocio o equipo?

Capacita a tus empleados en los temas más solicitados con edX para Negocios.