Kursplan
Introduksjon
- Introduksjon til skybaserte løsninger og Big Data
- Oversikt over Apache Hadoop funksjoner og arkitektur
Oppsetning av Hadoop
- Planlegging av en Hadoop-kluster (lokalt, skybasert, etc.)
- Valg av operativsystem og Hadoop-distribusjon
- Tilordning av ressurser (maskinvare, nettverk, etc.)
- Nedlasting og installering av programvare
- Dimensjonering av klusteret for fleksibilitet
Arbeid med HDFS
- Forståelse av Hadoop Distributed File System (HDFS)
- Oversikt over HDFS kommando referanse
- Tilgang til HDFS
- Utføre grunnleggende filoperasjoner på HDFS
- Bruk av S3 som komplement til HDFS
Oversikt over MapReduce
- Forståelse av dataflyt i MapReduce-rammeverket
- Map, Shuffle, Sort og Reduce
- Demo: Beregning av høyeste lønn
Arbeid med YARN
- Forståelse av ressurshåndtering i Hadoop
- Arbeid med ResourceManager, NodeManager og Application Master
- Planlegging av oppgaver under YARN
- Planlegging for et stort antall noder og kluster
- Demo: Oppgaveplanlegging
Integrering av Hadoop med Spark
- Oppsett av lagring for Spark (HDFS, Amazon, S3, NoSQL, etc.)
- Forståelse av Resilient Distributed Datasets (RDDs)
- Opprettelse av en RDD
- Implementering av RDD-transformasjoner
- Demo: Implementering av et tekst søkeprogram for filmtitler
Administrasjon av en Hadoop-kluster
- Overvåkning av Hadoop
- Sikring av en Hadoop-kluster
- Tilføyelse og fjerning av noder
- Kjøring av ytelsesbenchmark
- Tuning av en Hadoop-kluster for optimal ytelse
- Sikkerhetskopiering, gjenoppretting og planlegging for forretningskontinuitet
- Sikring av høy tilgjengelighet (HA)
Oppgradering og migrering av en Hadoop-kluster
- Vurdering av arbeidsbelastningskrav
- Oppgradering av Hadoop
- Flytting fra lokalt til skybasert og omvendt
- Gjenoppretting fra feil
Feilsøking
Oppsummering og konklusjon
Krav
- Erfaring med systemadministrasjon
- Erfaring med Linux kommando-linje
- En forståelse av big data-begreper
Målgruppe
- Systemadministratorer
- DBAs
Referanser (5)
De live-eksemplene
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskinoversatt
meget interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskinoversatt
Nokkel praktisk erfaring, instruktøren er kunnskapsrik
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maskinoversatt
Få muligheten til å lære Spark Streaming, Databricks og AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maskinoversatt
praktiske ting med å gjøre, også teorien ble godt fremmet av Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurs - Hadoop Administration on MapR
Maskinoversatt