Kursplan

Del 1: Introduksjon til Hadoop

    hadoop historie, konsepter øko system distribusjoner høynivå arkitektur hadoop myter hadoop utfordringer maskinvare / programvare lab : se først på Hadoop

Seksjon 2: HDFS

    Design- og arkitekturkonsepter (horisontal skalering, replikering, datalokalitet, rackbevissthet) Daemons : Namenode, Secondary namenode, Datanodekommunikasjon / hjerteslag dataintegritet lese-/skrivebane Namenode High Availability (HA), Federation Labs : Interaksjon med HDFS

Seksjon 3: Kartreduser

    konsepter og arkitekturdemoner (MRV1): jobbsporer / oppgavesporingsfaser: driver, kartlegger, stokk/sorter, redusering Map Reduce versjon 1 og versjon 2 (YARN) Internaler av Map Reduce Introduksjon til Java Map Reduce programlaboratorier: Kjøre et eksempel på MapReduce program

Seksjon 4 : Gris

    pig vs java map reduser gris jobbflyt gris latinsk ETL med Pig Transformations & Joins Brukerdefinerte funksjoner (UDF) laboratorier: skrive griseskript for å analysere data

Del 5: Hive

    arkitektur og designdatatyper SQL støtte i Hive Opprette Hive-tabeller og spørrepartisjoner blir med tekstbehandlingslaboratorier: forskjellige laboratorier for behandling av data med Hive

Seksjon 6: HBase

    konsepter og arkitektur hbase vs RDBMS vs cassandra HBase Java API-tidsseriedata på HBase-skjemadesignlaboratorier: Interaksjon med HBase ved hjelp av skall; programmering i HBase Java API ; Skjemadesignøvelse

Krav

  • komfortabel med Java programmeringsspråk (de fleste programmeringsøvelser er i java)
  • komfortabel i Linux miljø (kunne navigere Linux kommandolinje, redigere filer med vi / nano)

Laboratoriemiljø

Zero Install : Det er ikke nødvendig å installere hadoop-programvare på elevenes maskiner! En fungerende hadoop-klynge vil bli gitt for studenter.

Studentene trenger følgende

  • en SSH-klient (Linux og Mac har allerede ssh-klienter, for Windows Putty anbefales)
  • en nettleser for å få tilgang til klyngen. Vi anbefaler nettleseren Firefox
  28 timer
 

Antall deltakere


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.

Price per participant

Testimonials (3)

Relaterte kurs

Related Categories