Kursplan
Introduksjon til Apache Iceberg
- Oversikt over Apache Iceberg
- Betydning og brukssaker i moderne dataarkitektur
- Nøkkeltrekk og fordeler
Grunnleggende konsepter
- Iceberg-tabellformat og arkitektur
- Sammenligning med andre tabellformater
- Partisjonering og skjemautvikling
- Tidsreise og dataversjonering
Oppsett av Apache Iceberg
- Installasjon og konfigurering
- Integrering av Iceberg med forskjellige data-behandlingsmotor
- Oppsett av en Iceberg-miljø på en lokal maskin
Grunnleggende operasjoner
- Oppretting og administrasjon av Iceberg-tabeller
- Skriving til og lesing fra Iceberg-tabeller
- Grunnleggende CRUD-operasjoner
Datamigrasjon og integrasjon
- Migrasjon av data fra Hive og andre systemer til Iceberg
- Integrering med BI-verktøy
- Migrasjon av et eksempel-dataset til Iceberg
Optimalisering av ytelse
- Ytelsestilpasningsteknikker
- Optimalisering av spørringer og data-scanning
- Ytelsesoptimalisering i Iceberg
Oversikt over avanserte funksjoner
- Partisjonsutvikling og skjult partisjonering
- Tabellutvikling og skjemendringer
- Tidsreise og tilbakestillingsfunksjoner
- Implementering av avanserte funksjoner i Iceberg
Oppsummering og neste steg
Krav
- Kjennskap med konsepter som tabeller, skjemaer, partisjoner og data-inntak
- Grunnleggende kunnskap i SQL
Målgruppe
- Dataingeniører
- Dataarkitekter
- Dataanalytikere
- Programvareutviklere
Referanser (3)
Jeg likte at det var praktisk. Elsket å anvende den teoretiske kunnskapen med praktiske eksempler.
Aurelia-Adriana - Allianz Services Romania
Kurs - Python and Spark for Big Data (PySpark)
Maskinoversatt
Det er en fordel at vi kunne medføre mest av informasjonen/kursmaterialet/presentasjonene/øvingene med oss, slik at vi kan se gjennom dem og kanskje gjøre om det vi ikke forsto første gang eller forbedre det vi allerede har gjort.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskinoversatt
meget interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskinoversatt