Kursplan

Introduksjon

    Introduksjon til Cloud Computing og Big Data-løsninger Oversikt over Apache Hadoop Funksjoner og arkitektur

Oppsett Hadoop

    Planlegging av en Hadoop-klynge (on-premise, sky, etc.) Velge OS og Hadoop-distribusjon Tilretteleggingsressurser (maskinvare, nettverk, etc.) Laste ned og installere programvaren Dimensjonere klyngen for fleksibilitet

Jobber med HDFS

    Forstå Hadoop Distribuert filsystem (HDFS) Oversikt over HDFS Command Reference Få tilgang til HDFS Utføre grunnleggende filoperasjoner på HDFS Bruke S3 som et komplement til HDFS

Oversikt over MapReduce

    Forstå dataflyt i MapReduce Framework Map, Shuffle, Sort and Reduce Demo: Computing Top Salaries

Arbeid med GARN

    Forstå ressursadministrasjon i Hadoop Arbeide med ResourceManager, NodeManager, Application Master Planleggingsjobber under YARN-planlegging for et stort antall noder og klynger Demo: Jobbplanlegging

Integrering Hadoop med Spark

    Sette opp lagring for Spark (HDFS, Amazon, S3, NoSQL, etc.) Forstå Resilient Distributed Dataset (RDDs) Opprette en RDD Implementere RDD Transformations Demo: Implementere et tekstsøkeprogram for filmtitler

Administrere en Hadoop klynge

    Overvåking Hadoop Sikre en Hadoop-klynge Legge til og fjerne noder Kjøre en ytelsesstandard Justere en Hadoop-klynge for å optimalisere ytelsen Sikkerhetskopiering, gjenoppretting og forretningskontinuitetsplanlegging Sikre høy tilgjengelighet (HA)

Oppgradere og migrere en Hadoop klynge

    Vurdere krav til arbeidsbelastning Oppgradering Hadoop Flytte fra lokalt til sky og omvendt Gjenoppretting etter feil

Feilsøking

Oppsummering og konklusjon

Krav

  • Erfaring med systemadministrasjon
  • Erfaring med Linux kommandolinje
  • En forståelse av big data-konsepter

Publikum

  • Systemadministratorer
  • DBAer
 35 timer

Antall deltakere



Price per participant

Testimonials (7)

Relaterte kurs

Related Categories