Ir al contenido principal

Big Data Analytics Using Spark

Learn how to analyze large datasets using Jupyter notebooks, MapReduce and Spark as a platform.

Big Data Analytics Using Spark

Elige tu sesión:

¡Ya se inscribieron 54,516! Una vez finalizada la sesión del curso, será archivado.
Comenzó el 17 ago
Termina el 30 nov
Comienza el 14 dic
Termina el 30 mar 2022
10 semanas estimadas
9–12 horas por semana
Al ritmo del instructor
Con un cronograma específico
Gratis
Verificación opcional disponible

Sobre este curso

Omitir Sobre este curso

In data science, data is called "big" if it cannot fit into the memory of a single standard laptop or workstation.

The analysis of big datasets requires using a cluster of tens, hundreds or thousands of computers. Effectively using such clusters requires the use of distributed files systems, such as the Hadoop Distributed File System (HDFS) and corresponding computational models, such as Hadoop, MapReduce and Spark.

In this course, part of the Data Science MicroMasters program, you will learn what the bottlenecks are in massive parallel computation and how to use spark to minimize these bottlenecks.

You will learn how to perform supervised an unsupervised machine learning on massive datasets using the Machine Learning Library (MLlib).

In this course, as in the other ones in this MicroMasters program, you will gain hands-on experience using PySpark within the Jupyter notebooks environment.

De un vistazo

  • Idioma: English
  • Transcripción de video: English
  • Programas asociados:

Lo que aprenderás

Omitir Lo que aprenderás
  • Programming Spark using Pyspark
  • Identifying the computational tradeoffs in a Spark application
  • Performing data loading and cleaning using Spark and Parquet
  • Modeling data through statistical and machine learning methods

Acerca de los instructores

¿Quién puede hacer este curso?

Lamentablemente, las personas residentes en uno o más de los siguientes países o regiones no podrán registrarse para este curso: Irán, Cuba y la región de Crimea en Ucrania. Si bien edX consiguió licencias de la Oficina de Control de Activos Extranjeros de los EE. UU. (U.S. Office of Foreign Assets Control, OFAC) para ofrecer nuestros cursos a personas en estos países y regiones, las licencias que hemos recibido no son lo suficientemente amplias como para permitirnos dictar este curso en todas las ubicaciones. edX lamenta profundamente que las sanciones estadounidenses impidan que ofrezcamos todos nuestros cursos a cualquier persona, sin importar dónde viva.

¿Te interesa este curso para tu negocio o equipo?

Capacita a tus empleados en los temas más solicitados con edX para Negocios.