Kursplan
Introduksjon til Apache Iceberg
- Oversikt over Apache Iceberg
- Gjenomgang av grunnleggende konsepter
Dypdykk i Iceberg-arkitektur
- Dybdeanalyse av Icebergs tabellformat
- Detaljert oversikt over arkitektur, inkludert metadata og filopplegg
- Intern arbeid med skjemaundring og partisjoner
Avansert Installasjon og Konfigurasjon
- Konfigurering av Iceberg for optimal ytelse i ulike miljøer
- Integrasjon med ulike databehandlingsmotorer
- Avansert oppsett: sikkerhet, kryptering og tilgangskontroll
- Oppsett av Iceberg i et distribuert miljø
Avanserte Operasjoner og Vedlikehold
- Administrasjon av store Iceberg-tabeller
- Implementering og administrering av komplekse skjemaundringer
- Håndtering av partisjoner og skjulte partisjoner
- Avanserte CRUD-operasjoner med skjemaundringer og partisjoner
Metoder for Spørreoptimering
- Metoder for å redusere spørretid
- Partisjonering og filpruning
- Metadatacaching og optimeringsstrategier
- Implementering og testing av spørreoptimeringsmetoder
Ytelsesjustering for Store Datamengder
- Optimalisering av ytelse for store datamengder
- Bruk av Icebergs innebygde funksjoner for ytelsesjustering
- Tilfeller av ytelsesjustering i virkelige scenarier
- Justering av ytelse for store datamengder
Avansert Dataflytting og Integrasjon
- Flytting av komplekse datastrukturer fra andre systemer
- Integrering av Iceberg med sanntidsdatastrømmer
- Flytting av komplekse datasett og integrering av sanntidsdatastrømmer
Tilgjengelighet og Konsistens
- Sikring av datakonsistens og -integritet i distribuerte miljøer
- Implementering og administrasjon av transaksjonsgarantier
- Håndtering av feil og gjenopprettingsmekanismer
- Implementering av tilgjengelighets- og konsistensfunksjoner
Avanserte Egenskaper og Tilpasning
- Tilpassede katalogimplementeringer
- Utvidelse av Iceberg med egne egenskaper
- Implementering av tilpasset katalog og utvidelse av Iceberg-funksjonalitet
Datastyring og Overholdelse
- Implementering av datastyringspolitikker
- Overholdelse av datareguleringer
- Administrasjon av revideringsspor og datalinje
- Implementering av styrings- og overholdelsesfunksjoner
Sammenfattning og Neste Skritt
Krav
- Kjennskap til kjernekonsepter, grunnleggende operasjoner og Iceberg tabellhåndtering
Målgruppe
- Dataingeniører
- Dataarkitekter
- Dataanalytikere
- Programvareutviklere
Referanser (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks