UCSanDiegoX: Big Data Analytics Using Spark

4.3 stars

14 ratings

Learn how to analyze large datasets using Jupyter notebooks, MapReduce and Spark as a platform.

10 semanas

9–12 horas por semana

Al ritmo del instructor

Con un cronograma específico

Gratis

Verificación opcional disponible

Hay una sesión disponible:

¡Ya se inscribieron 59,846! Una vez finalizada la sesión del curso, será archivado.

Comienza el 15 dic

Termina el 4 abr 2025

Inscríbete ahora

Me gustaría recibir correos electrónicos de UCSanDiegoX e informarme sobre otras ofertas relacionadas con Big Data Analytics Using Spark.

Inscríbete ahora

Comienza el 15 dic

Sobre este curso

Omitir Sobre este curso

In data science, data is called "big" if it cannot fit into the memory of a single standard laptop or workstation.

The analysis of big datasets requires using a cluster of tens, hundreds or thousands of computers. Effectively using such clusters requires the use of distributed files systems, such as the Hadoop Distributed File System (HDFS) and corresponding computational models, such as Hadoop, MapReduce and Spark.

In this course, part of the Data Science MicroMasters program, you will learn what the bottlenecks are in massive parallel computation and how to use spark to minimize these bottlenecks.

You will learn how to perform supervised an unsupervised machine learning on massive datasets using the Machine Learning Library (MLlib).

In this course, as in the other ones in this MicroMasters program, you will gain hands-on experience using PySpark within the Jupyter notebooks environment.

De un vistazo

Institution UCSanDiegoX
Subject Análisis de datos
Level Advanced
Prerequisites
1. The previous courses in the MicroMasters program: DSE200x,DSE210xand DSE220x

Language English
Video Transcript English
Associated programs
- Programa MicroMasters^® en Data Science
Associated skillsApache Hadoop, Machine Learning, Data Science, Hadoop Distributed File System (HDFS), MapReduce, Big Data, Distributed File Systems, Apache Spark, Big Data Analytics, Jupyter, Pyspark

Lo que aprenderás

Omitir Lo que aprenderás

Programming Spark using Pyspark
Identifying the computational tradeoffs in a Spark application
Performing data loading and cleaning using Spark and Parquet
Modeling data through statistical and machine learning methods

¿Quién puede hacer este curso?

Lamentablemente, las personas residentes en uno o más de los siguientes países o regiones no podrán registrarse para este curso: Irán, Cuba y la región de Crimea en Ucrania. Si bien edX consiguió licencias de la Oficina de Control de Activos Extranjeros de los EE. UU. (U.S. Office of Foreign Assets Control, OFAC) para ofrecer nuestros cursos a personas en estos países y regiones, las licencias que hemos recibido no son lo suficientemente amplias como para permitirnos dictar este curso en todas las ubicaciones. edX lamenta profundamente que las sanciones estadounidenses impidan que ofrezcamos todos nuestros cursos a cualquier persona, sin importar dónde viva.

Este curso es parte del programa Data Science MicroMasters

Más información

Instrucción por expertos

4 cursos de nivel universitario

10 meses

9 - 11 horas semanales

Formas de realizar este curso

Elige tu camino al inscribirte.

Inscríbete ahora

Comienza el 15 dic

	Verified Track	Audit Track
Costo	350 US$	Free
Acceso a los materiales del curso	Ilimitado	Limitado Caduca el 23 feb 2025
World class institutions and universities
Asistencia de edX
Certificado para compartir al finalizar
Tareas con calificación y exámenes

Visita la sección de Preguntas frecuentes con preguntas frecuentes sobre estas modalidades.

¿Te interesa este curso para tu negocio o equipo?

Capacita a tus empleados en los temas más solicitados con edX para Negocios.

Comprar

Solicitar información

UCSanDiegoX: Big Data Analytics Using Spark

Hay una sesión disponible:

Big Data Analytics Using Spark

Inscríbete ahora

Sobre este curso

De un vistazo

Lo que aprenderás

¿Quién puede hacer este curso?

Este curso es parte del programa Data Science MicroMasters

Formas de realizar este curso

Inscríbete ahora

Verified Track

Audit Track

Costo

Acceso a los materiales del curso

World class institutions and universities

Asistencia de edX

Certificado para compartir al finalizar

Tareas con calificación y exámenes

¿Te interesa este curso para tu negocio o equipo?