Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Oversikt: Big Data
- Hva er Big Data
- Hvorfor Big Data blir stadig mer populært
- Big Data Cases
- Karakteristika ved Big Data
- Løsninger for å arbeide med Big Data.
Hadoop & dets komponenter:
- Hva er Hadoop og hva er dets komponenter.
- Hadoop Arkitektur og dens karakteristika for data det kan håndtere/prosessere.
- Kort oversikt over Hadoop historie, selskaper som bruker det og hvorfor de har begynt å bruke det.
- Hadoop Rammeverk & dets komponenter - forklares i detalj.
- Hva er HDFS og lesing-skriving til Hadoop Distributed File System.
- Hvordan opprette Hadoop kluster i forskjellige moduser - Stand-alone/Pseudo/Multi Node kluster.
(Dette inkluderer oppsett av et Hadoop kluster i VirtualBox/KVM/VMware, nettverksinnstillinger som må vurderes nøye, kjøring av Hadoop Daemons og testing av klusteret).
- Hva er Map Reduce rammeverk og hvordan det fungerer.
- Kjøring av Map Reduce oppgaver på Hadoop kluster.
- Forståelse av replikasjon, speiling og rack-oppmerksomhet i forhold til Hadoop klustre.
Hadoop Klusterplanlegging:
- Hvordan planlegge ditt Hadoop-kluster.
- Forståelse av maskinvare-programvare for å planlegge ditt Hadoop-kluster.
- Forståelse av arbeidsbelastninger og planlegging av kluster for å unngå feil og yte optimalt.
Hva er MapR og hvorfor MapR:
- Oversikt over MapR og dens arkitektur.
- Forståelse og arbeid med MapR Control System, MapR Volumes, snapshooter og speilinger.
- Planlegging av kluster i forhold til MapR.
- Sammenligning av MapR med andre distribusjoner og Apache Hadoop.
- MapR installasjon og klusterdeployering.
Klusteroppsett & administrasjon:
- Administrering av tjenester, noder, snapshooter, speilvolumer og fjernklustre.
- Forståelse og administrering av noder.
- Forståelse av Hadoop komponenter, installering av Hadoop komponenter i samspill med MapR-tjenester.
- Accessing av data på kluster, inkludert via NFS Administrering av tjenester & noder.
- Administrering av data ved bruk av volumer, administrering av brukere og grupper, tildeling av roller til noder, kommisjonering/dekommisjonering av noder, klusteradministrasjon og ytelsesovervåking, konfigurasjon/analyse og overvåking av metrikker for å overvåke ytelse, konfigurasjon og administrasjon av MapR-sikkerhet.
- Forståelse og arbeid med M7 - Nativer lagring for MapR-tabeller.
- Klusterkonfigurasjon og justering for optimal ytelse.
Klusteroppgradering og integrasjon med andre oppsett:
- Oppgradering av programvareversjonen til MapR og typer oppgraderinger.
- Konfigurasjon av MapR-kluster for å få tilgang til HDFS-kluster.
- Oppsett av MapR-kluster på Amazon Elastic Mapreduce.
Alle de ovennevnte emnene inkluderer demonstrasjoner og praktiske øvelser slik at lærere får hånds-on erfaring med teknologien.
Krav
- Grunnleggende kunnskap om Linux FS
- Grunnleggende Java
- Kunnskap om Apache Hadoop (anbefalt)
28 timer
Testimonials (1)
practical things of doing, also theory was served good by Ajay