Kursplan

Greenplum Arkitektur

  • Parallelle behandling og symmetrisk multiprosessering
  • Segmentroller og klusterkonfigurasjon
  • Skalerbarhet og databevegelse
  • Greenplum Data Warehouse arkitektur

Greenplum Tabellstrukturer

  • Fordelte vs. tilfeldig tilordnete tabeller
  • Heap vs. kun-tilleggs-tabeller
  • Rad- vs. kolonnebaserte lagringsformater
  • Partisjonerte og klustrerte tabeller

Datafordeling og Hashing

  • Hash-logikk og fordelingsnøkler
  • Håndtering av skjevhet og ytelsespåvirkning
  • Hash-kart og radplasseringstrategier

Indekser og Ytelsesoptimalisering

  • Klustrerte og ikke-klustrerte indekser
  • B-tree- og bitmap-indeksbrukstilfeller
  • Indekssøk og lagringsadferd

Fysisk Database Design

  • Normalisering og logisk modelldesign
  • Brukeradgangsstrategier og fordelingsanalyse
  • Datademografi og indeksvalg

Denormaliseringsmetoder

  • Avledet data, samletabeller og forhåndsforbindelser
  • Kolonnebaserte tabeller som vertikal partisjonering
  • Datamarts og materialiserte visninger

Avanserte SQL og Spørringsutførelse

  • Forbindelsesstrategier og omfordeling
  • OLAP og vindusfunksjoner
  • Midlertidige tabeller, underspørringer og avledede tabeller

EXPLAIN-planer og Spørringstuning

  • Lesing og tolking av EXPLAIN-utdata
  • Kostnadsanalyse og planoptimalisering
  • Bevegelse av forbindelser og segmentlokale operasjoner

Greenplum Verktøy og Beste Praksiser

  • ANALYZE og VACUUM
  • Lasting og bevegelse av data med Nexus
  • Sikkerhet, tillatelser og ytelsestips

Sammenfatning og Neste Skritt

Krav

  • En forståelse av relasjonsdatabaser og SQL
  • Erfaring med datawarehousing eller analytiske systemer
  • Kjennskap til Linux kommandolinjeoperasjoner

Målgruppe

  • Dataarkitekter og ingeniører
  • Database administratorer og tekniske ledere
  • BI-utviklere og analytikere som arbeider med Greenplum
 21 timer

Antall deltakere


Price per participant

Testimonials (3)

Upcoming Courses

Related Categories