Kursplan

Seksjon 1: Data Management i HDFS

  • Forskjellige datformater (JSON / Avro / Parquet)
  • Komprimeringsskjemer
  • Datamaskering
  • Laboratorier: Analysere forskjellige dataformater; aktivering av komprimering

Seksjon 2: Avansert Pig

  • Brukerdefinerte funksjoner
  • Introduksjon til Pig-biblioteker (ElephantBird / Data-Fu)
  • Lasting av komplisert strukturert data ved hjelp av Pig
  • Pig-justering
  • Laboratorier: avansert Pig-skripting, tolking av komplekse datatyper

Seksjon 3 : Avansert Hive

  • Brukerdefinerte funksjoner
  • Komprimerte tabeller
  • Hive-yting
  • Laboratorier: opprette komprimerte tabeller, vurdere tabellformater og konfigurasjon

Seksjon 4 : Avansert HBase

  • Avansert skjemamodellering
  • Komprimering
  • Inntak av store datamengder
  • Sammenligning av bredtavle / høytavle
  • HBase og Pig
  • HBase og Hive
  • HBase-yting
  • Laboratorier: justering av HBase; tilgang til HBase-data fra Pig & Hive; Bruk av Phoenix for datamodellering

Krav

  • komfortabel med Java-programmeringsspråk (mest programmeringsøvelser er i java)
  • komfortabel i Linux-miljøet (kunne navigere i Linux kommando-linje, redigere filer ved hjelp av vi / nano)
  • arbeids- kjenne til Hadoop.

Lab-miljø

Ingen Installasjon: Det er ikke behov for å installere Hadoop-programvare på studentenes maskiner! En fungerende Hadoop-kluster vil bli tilgjengeliggjort for studentene.

Studentene vil trenge følgende

 21 timer

Antall deltakere


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories