Fundamentos de Big Data

← Volver a Classes

Course Description

Este curso de postgrado introduce a los estudiantes en el ecosistema de Big Data, cubriendo tecnologías y técnicas para el procesamiento y análisis de grandes volúmenes de datos. Se exploran herramientas como Hadoop, Spark, y bases de datos NoSQL. Los estudiantes aprenderán arquitecturas de datos distribuidos y técnicas de procesamiento en paralelo para manejar datos a escala empresarial.

Syllabus and Course Schedule

Objetivos del Curso

Contenido Temático

  1. Introducción al Big Data y las 5 V’s
  2. Ecosistema Hadoop (HDFS, MapReduce, YARN)
  3. Apache Spark (RDD, DataFrames, Spark SQL)
  4. Bases de datos NoSQL (HBase, Cassandra)
  5. Procesamiento de streams (Kafka, Spark Streaming)
  6. Data lakes y arquitecturas Lambda
  7. Machine learning a escala
  8. Casos de uso empresariales
Event Date Description Materials and Assignments
Lecture 1 Saturday
Apr 6
Section Topics:
  1. ¿Qué es Big Data?
  2. Desafíos y oportunidades
  3. Presentación del Syllabus
Handouts
Lecture 2 Saturday
Apr 13
Section Topics:
  1. Arquitectura Hadoop
  2. HDFS y MapReduce
  3. Implementación práctica
Assignments
Lecture 3 Saturday
Apr 20
Section Topics:
  1. Introducción a Apache Spark
  2. RDDs y transformaciones
  3. Spark SQL
Lab
Lecture 4 Saturday
Apr 27
Section Topics:
  1. Bases de datos NoSQL
  2. HBase y Cassandra
  3. Casos de uso
Assignments