Kursplan

  1. Grunnleggende prinsipper for Big Data
    • Big Data og dens rolle i det korporative miljøet
    • Fasene i utviklingen av en Big Data-strategi innenfor en virksomhet
    • Forklar grunnen for en helhetlig tilnærming til Big Data
    • Komponenter som kreves i en Big Data-plattform
    • Big Data lagringsløsning
    • Grenser for tradisjonelle teknologier
    • Oversikt over databasetyper
    • De fire dimensjonene av Big Data
  2. Big Data sin påvirkning på forretningsvirksomhet
    • Forretningsmessig betydning av Big Data
    • Utfordringer med å trekke ut nyttig data
    • Integrering av Big Data med tradisjonell data
  3. Big Data lagringsteknologier
    • Oversikt over Big Data teknologier
      • Data lagringsmodeller
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Å velge riktig Big Data teknologi
  4. Behandling av Big Data
    • Tilkobling og utvinning av data fra database
    • Transformering og forberedelse av data for behandling
    • Bruk av Hadoop MapReduce for behandling av fordelt data
    • Overvåking og utførelse av Hadoop MapReduce oppgaver
    • Byggesteiner i Hadoop distribuerte filsystemer
    • Mapreduce og Yarn
    • Håndtering av strømmedata med Spark
  5. Verkty og teknologier for Big Data analyse
    • Programmering av Hadoop med Pig Latin språk
    • Spørring av Big Data med Hive
    • Datautvinning med Mahout
    • Visualiserings- og rapportverktøy
  6. Big Data i forretningsvirksomhet
    • Administrasjon og etablering av Big Data-behov
    • Forretningsmessig betydning av Big Data
    • Valg av riktige Big Data-verktøy for problemet

Konsepter for datawarehousing

  • Hva er datawarehousing?
  • Forskjeller mellom OLTP og datawarehousing
  • Innhenting av data
  • Utvinning av data
  • Transformering av data
  • Lasting av data
  • Data Marts
  • Avhengig vs uavhengig data Mart
  • Database design

Konsepter for ETL-testing:

  • Introduksjon
  • Programvareutviklingslivssyklus
  • Testmetodologier
  • ETL-testing arbeidsflytprosess
  • Ansvar for ETL-testing i datastadier

Grunnleggende prinsipper for Big Data

  • Big Data og dens rolle i det korporative miljøet
  • Fasene i utviklingen av en Big Data-strategi innenfor en virksomhet
  • Forklar grunnen for en helhetlig tilnærming til Big Data
  • Komponenter som kreves i en Big Data-plattform
  • Big Data lagringsløsning
  • Grenser for tradisjonelle teknologier
  • Oversikt over databasetyper

NoSQL-databaser

Hadoop

Map Reduce

Apache Spark

Krav

Delegater bør ha en bevissthet og en viss erfaring med lagringsverktøy og en bevissthet om å håndtere store datasett

 14 timer

Antall deltakere


Pris per deltaker

Referanser (1)

Kommende kurs

Relaterte kategorier