Ir al contenido principal

UCSanDiegoX: Big Data Analytics Using Spark

4.4 stars
11 ratings

Learn how to analyze large datasets using Jupyter notebooks, MapReduce and Spark as a platform.

Big Data Analytics Using Spark
10 semanas
9–12 horas por semana
Al ritmo del instructor
Con un cronograma específico
Gratis
Verificación opcional disponible

Hay una sesión disponible:

¡Ya se inscribieron 59,277! Una vez finalizada la sesión del curso, será archivadoAbre en una pestaña nueva.
Comenzó el 26 mar
Termina el 12 jul

Sobre este curso

Omitir Sobre este curso

In data science, data is called "big" if it cannot fit into the memory of a single standard laptop or workstation.

The analysis of big datasets requires using a cluster of tens, hundreds or thousands of computers. Effectively using such clusters requires the use of distributed files systems, such as the Hadoop Distributed File System (HDFS) and corresponding computational models, such as Hadoop, MapReduce and Spark.

In this course, part of the Data Science MicroMasters program, you will learn what the bottlenecks are in massive parallel computation and how to use spark to minimize these bottlenecks.

You will learn how to perform supervised an unsupervised machine learning on massive datasets using the Machine Learning Library (MLlib).

In this course, as in the other ones in this MicroMasters program, you will gain hands-on experience using PySpark within the Jupyter notebooks environment.

De un vistazo

  • Language English
  • Video Transcript English
  • Associated programs
  • Associated skillsDistributed File Systems, Data Science, Pyspark, Apache Spark, Machine Learning, MapReduce, Big Data Analytics, Big Data, Hadoop Distributed File System (HDFS), Apache Hadoop, Jupyter

Lo que aprenderás

Omitir Lo que aprenderás
  • Programming Spark using Pyspark
  • Identifying the computational tradeoffs in a Spark application
  • Performing data loading and cleaning using Spark and Parquet
  • Modeling data through statistical and machine learning methods

¿Quién puede hacer este curso?

Lamentablemente, las personas residentes en uno o más de los siguientes países o regiones no podrán registrarse para este curso: Irán, Cuba y la región de Crimea en Ucrania. Si bien edX consiguió licencias de la Oficina de Control de Activos Extranjeros de los EE. UU. (U.S. Office of Foreign Assets Control, OFAC) para ofrecer nuestros cursos a personas en estos países y regiones, las licencias que hemos recibido no son lo suficientemente amplias como para permitirnos dictar este curso en todas las ubicaciones. edX lamenta profundamente que las sanciones estadounidenses impidan que ofrezcamos todos nuestros cursos a cualquier persona, sin importar dónde viva.

Este curso es parte del programa Data Science MicroMasters

Más información 
Instrucción por expertos
4 cursos de nivel universitario
10 meses
9 - 11 horas semanales

¿Te interesa este curso para tu negocio o equipo?

Capacita a tus empleados en los temas más solicitados con edX para Negocios.