Ir al contenido principal

Big Data Analytics Using Spark

Learn how to analyze large datasets using Jupyter notebooks, MapReduce and Spark as a platform.

...
Big Data Analytics Using Spark

Elige tu sesión:

¡Ya se inscribieron 58,209 usuarios!
Comenzó el 18 abr
Termina el 4 ago
Comienza el 8 ago
Termina el 1 dic

Big Data Analytics Using Spark

Learn how to analyze large datasets using Jupyter notebooks, MapReduce and Spark as a platform.

Big Data Analytics Using Spark
10 semanas
9–12 horas por semana
Al ritmo del instructor
Con un cronograma específico
Gratis
Verificación opcional disponible

Elige tu sesión:

¡Ya se inscribieron 58,209! Una vez finalizada la sesión del curso, será archivadoAbre en una pestaña nueva.
Comenzó el 18 abr
Termina el 4 ago
Comienza el 8 ago
Termina el 1 dic

Sobre este curso

Omitir Sobre este curso

In data science, data is called "big" if it cannot fit into the memory of a single standard laptop or workstation.

The analysis of big datasets requires using a cluster of tens, hundreds or thousands of computers. Effectively using such clusters requires the use of distributed files systems, such as the Hadoop Distributed File System (HDFS) and corresponding computational models, such as Hadoop, MapReduce and Spark.

In this course, part of the Data Science MicroMasters program, you will learn what the bottlenecks are in massive parallel computation and how to use spark to minimize these bottlenecks.

You will learn how to perform supervised an unsupervised machine learning on massive datasets using the Machine Learning Library (MLlib).

In this course, as in the other ones in this MicroMasters program, you will gain hands-on experience using PySpark within the Jupyter notebooks environment.

De un vistazo

  • Idioma: English
  • Transcripción de video: English
  • Programas asociados:
  • Associated skills:Jupyter, Big Data Analytics, Big Data, Apache Hadoop, Hadoop Distributed File System (HDFS), Pyspark, MapReduce, Machine Learning, Distributed File Systems, Data Science, Apache Spark

Lo que aprenderás

Omitir Lo que aprenderás
  • Programming Spark using Pyspark
  • Identifying the computational tradeoffs in a Spark application
  • Performing data loading and cleaning using Spark and Parquet
  • Modeling data through statistical and machine learning methods

Acerca de los instructores

¿Quién puede hacer este curso?

Lamentablemente, las personas residentes en uno o más de los siguientes países o regiones no podrán registrarse para este curso: Irán, Cuba y la región de Crimea en Ucrania. Si bien edX consiguió licencias de la Oficina de Control de Activos Extranjeros de los EE. UU. (U.S. Office of Foreign Assets Control, OFAC) para ofrecer nuestros cursos a personas en estos países y regiones, las licencias que hemos recibido no son lo suficientemente amplias como para permitirnos dictar este curso en todas las ubicaciones. edX lamenta profundamente que las sanciones estadounidenses impidan que ofrezcamos todos nuestros cursos a cualquier persona, sin importar dónde viva.

This course is part ofData Science MicroMasters Program

Más información 
Instrucción por expertos
4 cursos de nivel universitario
10 meses
9 - 11 horas semanales

¿Te interesa este curso para tu negocio o equipo?

Train your employees in the most in-demand topics, with edX For Business.