Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.
Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.
Kursplan
Introduksjon
- Introduksjon til skybaserte løsninger og Big Data
- Oversikt over Apache Hadoop funksjoner og arkitektur
Oppsetning av Hadoop
- Planlegging av en Hadoop-kluster (lokalt, skybasert, etc.)
- Valg av operativsystem og Hadoop-distribusjon
- Tilordning av ressurser (maskinvare, nettverk, etc.)
- Nedlasting og installering av programvare
- Dimensjonering av klusteret for fleksibilitet
Arbeid med HDFS
- Forståelse av Hadoop Distributed File System (HDFS)
- Oversikt over HDFS kommando referanse
- Tilgang til HDFS
- Utføre grunnleggende filoperasjoner på HDFS
- Bruk av S3 som komplement til HDFS
Oversikt over MapReduce
- Forståelse av dataflyt i MapReduce-rammeverket
- Map, Shuffle, Sort og Reduce
- Demo: Beregning av høyeste lønn
Arbeid med YARN
- Forståelse av ressurshåndtering i Hadoop
- Arbeid med ResourceManager, NodeManager og Application Master
- Planlegging av oppgaver under YARN
- Planlegging for et stort antall noder og kluster
- Demo: Oppgaveplanlegging
Integrering av Hadoop med Spark
- Oppsett av lagring for Spark (HDFS, Amazon, S3, NoSQL, etc.)
- Forståelse av Resilient Distributed Datasets (RDDs)
- Opprettelse av en RDD
- Implementering av RDD-transformasjoner
- Demo: Implementering av et tekst søkeprogram for filmtitler
Administrasjon av en Hadoop-kluster
- Overvåkning av Hadoop
- Sikring av en Hadoop-kluster
- Tilføyelse og fjerning av noder
- Kjøring av ytelsesbenchmark
- Tuning av en Hadoop-kluster for optimal ytelse
- Sikkerhetskopiering, gjenoppretting og planlegging for forretningskontinuitet
- Sikring av høy tilgjengelighet (HA)
Oppgradering og migrering av en Hadoop-kluster
- Vurdering av arbeidsbelastningskrav
- Oppgradering av Hadoop
- Flytting fra lokalt til skybasert og omvendt
- Gjenoppretting fra feil
Feilsøking
Oppsummering og konklusjon
Krav
- Erfaring med systemadministrasjon
- Erfaring med Linux kommando-linje
- En forståelse av big data-begreper
Målgruppe
- Systemadministratorer
- DBAs
35 timer
Referanser (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks