PUE

Curs de Cloudera Developer Training for Apache Hadoop - Presencial / Virtual Castellà

PUE

Curs
Presencial | Semi-presencial
Oficial / Homologat
28 Hores
  • Barcelona
1.670 €

Descripció

El curs permetrà als alumnes aprendre a dissenyar potents eines de processament de dades per mitjà de l'ocupació d'Apache Hadoop.

PUE és Training Partner oficial de Cloudera, autoritzat per aquesta multinacional per impartir formació oficial en tecnologies Cloudera.

PUE està també acreditat i reconegut per realitzar serveis de consultoria i mentoring a la implementació de solucions Cloudera en l'àmbit empresarial amb el consegüent valor afegit en l'enfocament pràctic i de negoci del coneixement que es trasllada en els seus cursos oficials.

Temari del curs

- Introducció.
- Objectius de Hadoop.
Problemàtica tradicional en sistemes de gran escala.
Introducció a Hadoop.
Com resol Hadoop problemes.
- Hadoop: Conceptes bàsics i HDFS.
El projecte Hadoop i els seus components.
El sistema distribuït de fitxers de Hadoop HDFS (Hadoop Distributed File System).
- Introducció a MapReduce.
Descripció dels aspectes generals de MapReduce.
Exemple: WordCount.
Mappers.
Reducers.
- Clúster i Ecosistema Hadoop.
Descripció dels aspectes generals del clúster Hadoop.
Treballs i tasques Hadoop.
Altres components de l'Ecosistema Hadoop.
- Escriure un programa MapReduce en Java.
Conceptes bàsics d'APIs MapReduce.
Escriure Drivers MapReduce, mappers i Reducers en Java.
Accelerar el funcionament de Hadoop emprant Eclipse.
Diferències entre APIs MapReduce antigues i noves.
- Escriure programes MapReduce emprant Streaming.
Escriure programes mappers i Reducers emprant APIs Streaming.
- Unitat d'exercicis de programes MapReduce.
Els entorns de prova JUnit i MRUnit.
Testeig amb MRUnit.
Execució de testeig de profunditat en APIs Hadoop.
- Aprofundir en l'API de Hadoop.
Ocupació de la Classe ToolRunner.
Configuració i desactivació de tasques Map i Redueix.
Disminució de dades intermedis amb combinadors.
Accés programàtic a HDFS.
Ocupació de memòria cau distribuïda.
Ocupació de llibreries d'APIs Map, Redueix i Partition.
- Practica de desenvolupament de tècniques i trucs.
Estratègies de depurat per codi MapReduce.
Testeig local de codi MapReduce emprant LocalJobRunner.
Accés i escriptura de fitxers log.
Recuperació d'informació de treball amb comptadors.
Reutilització d'objectes.
Creació de treballs MapReduce Map, Redueix o Partition.
Treball en conjunt de tasques Redueix i Partition.
Determinació de nombre òptim de tasques redueix per una feina.
Escriure tasques Partition customitzades.
- Sortida i entrada de dades.
Creació customitzada d'implementacions writable i writable-Comparable.
Conceptes a considerar en l'ocupació de compressió d'arxius.
Implementació customitzada de formats d'entrada i sortida (InputFormats i OutputFormats).
- Algorismes comuns en MapReduce.
Classificació i recerca de grans conjunts de dades.
Computació de Term Frequency i Inverse Document Frequency.
Càlcul de Co-ocurrència de paraula.
Creació i modelatge d'ordres secundàries.
- Accés a conjunts de dades en treballs MapReduce.
Escriure accessos Map-Side.
Escriure accessos Redueix-Side.
- Integració de flux de treball de Hadoop en entorns empresarials existents.
Integració de Hadoop ien entorns existents.
Càrrega de dades en HDFS des RDBMS emprant Sqoop.
Administració de dades en temps real emprant Flume.
Accés HDFS des de sistemes fiables amb FuseDFS i HttpFS.
- Introducció a Hive, Imapala, i Pig.
Objectius de Hive, Impala, i Pig.
Descripció dels aspectes generals de Hive.
Descripció dels aspectes generals de Impala.
Descripció dels aspectes generals de Pig.
Elecció entre Hive, Impala, i Pig.
- Introducció a Oozie.
Descripció dels aspectes generals de Oozie.
Creació de fluxos de treball amb Oozie.
- Conclusió.
 
Veure més

Destinataris

El curs està dirigit a desenvolupadors que volen aprendre a utilitzar Apache Hadoop per desenvolupar potents eines de processament de dades.

Requisits

Aquesta formació oficial està dissenyada per desenvolupadors amb una mica d'experiència en programació (preferiblement Java). No són necessaris els coneixements previs en Hadoop.

Horari/Torn



Durada

Dates de convocatòria a consultar

Objetius

Després de la finalització de la formació, el participant coneixerà:



     Les tecnologies clau de Hadoop.

     Com funciona HDFS MapReduce.

     Com desenvolupar aplicacions MapReduce.

     Com crear unitats de test (unit tests) per a aplicacions MapReduce.

     Com utilitzar els combiners, partitioners, i la memòria cau distribuïda d'un MapReduce.

     Millors pràctiques per al desenvolupament i depuració d'aplicacions MapReduce.

     Com implementar l'entrada i sortida de dades d'aplicacions MapReduce.

     Algorismes per a tasques comunes de MapReduce.

     Com unir conjunts de dades en MapReduce.

     Com s'integra Hadoop en el CPD.

     Com utilitzar els algoritmes Machine Learning de mahout.

     Com utilitzar Hive i Pig per al desenvolupament ràpid d'aplicacions.

     Com crear grans workflows utilitzant Oozie.

Titulació obtinguda

Després de la realització del present curs oficial estarà capacitat per superar l'examen de certificació: Cloudera Certified Developer for Apache Hadoop (CCDH).

Promocions

FORMACIÓ BONIFICADA si es reuneixen els requisits

Preu

1.670 €

Sí, m'interessa

conèixer tots els detalls, preus, beques, dates i places disponibles

Curs de Cloudera Developer Training for Apache Hadoop - Presencial / Virtual Castellà

Curs de Cloudera Developer Training for Apache Hadoop - Presencial / Virtual Castellà