Kursplan

Oversikt: Big Data

  • Hva er Big Data
  • Hvorfor Big Data blir stadig mer populært
  • Big Data Cases
  • Karakteristika ved Big Data
  • Løsninger for å arbeide med Big Data.

Hadoop & dets komponenter:

  • Hva er Hadoop og hva er dets komponenter.
  • Hadoop Arkitektur og dens karakteristika for data det kan håndtere/prosessere.
  • Kort oversikt over Hadoop historie, selskaper som bruker det og hvorfor de har begynt å bruke det.
  • Hadoop Rammeverk & dets komponenter - forklares i detalj.
  • Hva er HDFS og lesing-skriving til Hadoop Distributed File System.
  • Hvordan opprette Hadoop kluster i forskjellige moduser - Stand-alone/Pseudo/Multi Node kluster.

(Dette inkluderer oppsett av et Hadoop kluster i VirtualBox/KVM/VMware, nettverksinnstillinger som må vurderes nøye, kjøring av Hadoop Daemons og testing av klusteret).

  • Hva er Map Reduce rammeverk og hvordan det fungerer.
  • Kjøring av Map Reduce oppgaver på Hadoop kluster.
  • Forståelse av replikasjon, speiling og rack-oppmerksomhet i forhold til Hadoop klustre.

Hadoop Klusterplanlegging:

  • Hvordan planlegge ditt Hadoop-kluster.
  • Forståelse av maskinvare-programvare for å planlegge ditt Hadoop-kluster.
  • Forståelse av arbeidsbelastninger og planlegging av kluster for å unngå feil og yte optimalt.

Hva er MapR og hvorfor MapR:

  • Oversikt over MapR og dens arkitektur.
  • Forståelse og arbeid med MapR Control System, MapR Volumes, snapshooter og speilinger.
  • Planlegging av kluster i forhold til MapR.
  • Sammenligning av MapR med andre distribusjoner og Apache Hadoop.
  • MapR installasjon og klusterdeployering.

Klusteroppsett & administrasjon:

  • Administrering av tjenester, noder, snapshooter, speilvolumer og fjernklustre.
  • Forståelse og administrering av noder.
  • Forståelse av Hadoop komponenter, installering av Hadoop komponenter i samspill med MapR-tjenester.
  • Accessing av data på kluster, inkludert via NFS Administrering av tjenester & noder.
  • Administrering av data ved bruk av volumer, administrering av brukere og grupper, tildeling av roller til noder, kommisjonering/dekommisjonering av noder, klusteradministrasjon og ytelsesovervåking, konfigurasjon/analyse og overvåking av metrikker for å overvåke ytelse, konfigurasjon og administrasjon av MapR-sikkerhet.
  • Forståelse og arbeid med M7 - Nativer lagring for MapR-tabeller.
  • Klusterkonfigurasjon og justering for optimal ytelse.

Klusteroppgradering og integrasjon med andre oppsett:

  • Oppgradering av programvareversjonen til MapR og typer oppgraderinger.
  • Konfigurasjon av MapR-kluster for å få tilgang til HDFS-kluster.
  • Oppsett av MapR-kluster på Amazon Elastic Mapreduce.

Alle de ovennevnte emnene inkluderer demonstrasjoner og praktiske øvelser slik at lærere får hånds-on erfaring med teknologien.

Krav

  • Grunnleggende kunnskap om Linux FS
  • Grunnleggende Java
  • Kunnskap om Apache Hadoop (anbefalt)
 28 timer

Antall deltakere


Price per participant

Testimonials (1)

Upcoming Courses

Related Categories