Kursplan

Seksjon 1: Data Management i HDFS

  • Ulike dataformater (JSON / Avro / Parkett)
  • Komprimeringsskjemaer
  • Datamaskering
  • Labs : Analysere ulike dataformater; muliggjør komprimering

Seksjon 2: Avansert gris

  • Brukerdefinerte funksjoner
  • Introduksjon til grisebiblioteker (ElephantBird / Data-Fu)
  • Laster komplekse strukturerte data ved hjelp av Pig
  • Pig Tuning
  • Labs : avansert griseskripting, analysering av komplekse datatyper

Del 3 : Avansert Hive

  • Brukerdefinerte funksjoner
  • Komprimerte tabeller
  • Hive Ytelsesjustering
  • Labs : lage komprimerte tabeller, evaluere tabellformater og konfigurasjon

Seksjon 4 : Avansert HBase

  • Avansert skjemamodellering
  • Komprimering
  • Massedatainntak
  • Sammenligning med bredt bord / Høyt bord
  • HBase og Pig
  • HBase og Hive
  • HBase Performance Tuning
  • Labs: tuning av HBase; tilgang til HBase-data fra Pig & Hive; Bruker Phoenix for datamodellering

Krav

  • komfortabel med Java programmeringsspråk (de fleste programmeringsøvelser er i java)
  • komfortabel i Linux miljø (kunne navigere Linux kommandolinje, redigere filer med vi / nano)
  • en praktisk kunnskap om Hadoop.

Laboratoriemiljø

Zero Install: Det er ikke nødvendig å installere hadoop-programvare på elevenes maskiner! En fungerende hadoop-klynge vil bli gitt for studenter.

Studentene trenger følgende

  • en SSH-klient (Linux og Mac har allerede ssh-klienter, for Windows Putty anbefales)
  • en nettleser for å få tilgang til klyngen. Vi anbefaler nettleseren Firefox
 21 timer

Antall deltakere


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories