Kursplan

Seksjon 1: Data Management i HDFS

    Forskjellige dataformater (JSON / Avro / Parkett) komprimeringsskjemaer Datamaskeringslabs : Analyserer forskjellige dataformater; muliggjør komprimering

Seksjon 2: Avansert gris

    Brukerdefinerte funksjoner Introduksjon til grisebiblioteker (ElephantBird / Data-Fu) Laster komplekse strukturerte data ved hjelp av Pig Pig Tuning Labs: avansert griseskripting, analysering av komplekse datatyper

Del 3 : Avansert Hive

    Brukerdefinerte funksjoner komprimerte tabeller Hive Performance Tuning Labs: lage komprimerte tabeller, evaluere tabellformater og konfigurasjon

Seksjon 4: Avansert HBase

    Avansert skjemamodellering Komprimering Bulk Data Inntak Wide-table / Tall-tabell sammenligning HBase og Pig HBase og Hive HBase Performance Tuning Labs: tuning HBase; tilgang til HBase-data fra Pig & Hive; Bruker Phoenix for datamodellering

Krav

  • komfortabel med Java programmeringsspråk (de fleste programmeringsøvelser er i java)
  • komfortabel i Linux miljø (kunne navigere Linux kommandolinje, redigere filer med vi / nano)
  • en praktisk kunnskap om Hadoop.

Laboratoriemiljø

Zero Install: Det er ikke nødvendig å installere hadoop-programvare på elevenes maskiner! En fungerende hadoop-klynge vil bli gitt for studenter.

Studentene trenger følgende

  • en SSH-klient (Linux og Mac har allerede ssh-klienter, for Windows Putty anbefales)
  • en nettleser for å få tilgang til klyngen. Vi anbefaler nettleseren Firefox
 21 timer

Antall deltakere



Price per participant

Testimonials (3)

Relaterte kurs

Related Categories