-
Diseñar sistemas distribuidos que gestionen "grandes datos" utilizando Hadoop y tecnologías relacionadas.
-
Usar HDFS y MapReduce para almacenar y analizar datos a escala.
-
Usar Pig y Spark para crear scripts para procesar datos en un clúster Hadoop en formas más complejas.
-
Analizar datos relacionales usando Hive y MySQL
-
Analizar los datos no relacionales usando HBase, Cassandra y MongoDB
-
Consultar los datos interactivamente con Drill, Phoenix y Presto
-
Elija una tecnología de almacenamiento de datos apropiada para su aplicación
-
Comprender cómo los grupos de Hadoop son manejados por YARN, Tez, Mesos, Zookeeper, Zeppelin, Hue, y Oozie.
-
Publicar datos a su cúmulo de Hadoop usando Kafka, Sqoop, y Flume
-
Consumir datos de streaming usando Spark Streaming, Flink, y Storm
TOMAR ESTE CURSO