Kursplan
Seksjon 1: Data Management i HDFS
- Ulike dataformater (JSON / Avro / Parkett)
- Komprimeringsskjemaer
- Datamaskering
- Labs : Analysere ulike dataformater; muliggjør komprimering
Seksjon 2: Avansert gris
- Brukerdefinerte funksjoner
- Introduksjon til grisebiblioteker (ElephantBird / Data-Fu)
- Laster komplekse strukturerte data ved hjelp av Pig
- Pig Tuning
- Labs : avansert griseskripting, analysering av komplekse datatyper
Del 3 : Avansert Hive
- Brukerdefinerte funksjoner
- Komprimerte tabeller
- Hive Ytelsesjustering
- Labs : lage komprimerte tabeller, evaluere tabellformater og konfigurasjon
Seksjon 4 : Avansert HBase
- Avansert skjemamodellering
- Komprimering
- Massedatainntak
- Sammenligning med bredt bord / Høyt bord
- HBase og Pig
- HBase og Hive
- HBase Performance Tuning
- Labs: tuning av HBase; tilgang til HBase-data fra Pig & Hive; Bruker Phoenix for datamodellering
Krav
- komfortabel med Java programmeringsspråk (de fleste programmeringsøvelser er i java)
- komfortabel i Linux miljø (kunne navigere Linux kommandolinje, redigere filer med vi / nano)
- en praktisk kunnskap om Hadoop.
Laboratoriemiljø
Zero Install: Det er ikke nødvendig å installere hadoop-programvare på elevenes maskiner! En fungerende hadoop-klynge vil bli gitt for studenter.
Studentene trenger følgende
- en SSH-klient (Linux og Mac har allerede ssh-klienter, for Windows Putty anbefales)
- en nettleser for å få tilgang til klyngen. Vi anbefaler nettleseren Firefox
Testimonials (5)
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurs - Impala for Business Intelligence
practical things of doing, also theory was served good by Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurs - Hadoop Administration on MapR
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Kurs - Big Data Analytics in Health
Liked very much the interactive way of learning.
Luigi Loiacono
Kurs - Data Analysis with Hive/HiveQL
I mostly liked the trainer giving real live Examples.