Kursplan

Greenplum-arkitektur

  • Parallelle behandling og symmetrisk flerprossing
  • Segmentroller og klusterkonfigurasjon
  • Skalerbarhet og databevegelse
  • Greenplum Data Warehouse-arkitektur

Greenplum Tabellstrukturer

  • Fordelt vs. tilfeldig tildelte tabeller
  • Heap vs. bare-tillegg tabeller
  • Rad- vs. kolonnestruktur
  • Partisjonerte og klustrerte tabeller

Datadistribusjon og Hashing

  • Hashing-logikk og distribusjonsnøkler
  • Skew-håndtering og ytelsespåvirkning
  • Hashkart og radplasseringstrategier

Indekser og Ytelsesoptimalisering

  • Klustrerte og ikke-klustrerte indekser
  • B-tree og bitmap indekser
  • Indeksøk og lagringsatferd

Fysisk Databasedesign

  • Normalisering og logisk modelldesign
  • Brukeradgangsstrategier og distribusjonsanalyse
  • Datademografi og indeksvalg

Deknormaliseringsteknikker

  • Derivert data, sammendragstabeller og forhånds-join
  • Kolonnestrukturer som vertikalt partisjonering
  • Datamarts og materialiserte syner

Avansert SQL og Spørringseksjeksjon

  • Join-strategier og omfordeling
  • OLAP og vindusfunksjoner
  • Midlertidige tabeller, underforespørsler og derivert tabeller

EXPLAIN-planer og Spørringstilpasning

  • Lesing og tolking av EXPLAIN-utdata
  • Kostnadsanalyse og planoptimalisering
  • Join-bevegelse og segmentlokal drift

Greenplum-verktøy og beste praksis

  • ANALYZE og VACUUM
  • Datainnlasting og flytting med Nexus
  • Sikkerhet, tillatelser og ytelsestips

Oppsummering og Neste Skritt

Krav

  • En forståelse av relasjonsdatabaser og SQL
  • Erfaring med datalagring eller analytiske systemer
  • Kjennskap med Linux kommando-linjebruk

Målgruppe

  • Dataarkitekter og ingeniører
  • Databaseadministratorer og tekniske ledere
  • BI-utviklere og analytikere som jobber med Greenplum
 21 timer

Antall deltakere


Pris per deltaker

Referanser (1)

Kommende kurs

Relaterte kategorier