Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.
Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.
Kursplan
Introduksjon til Apache Iceberg
- Oversikt over Apache Iceberg
- Betydning og brukssaker i moderne dataarkitektur
- Nøkkeltrekk og fordeler
Grunnleggende konsepter
- Iceberg-tabellformat og arkitektur
- Sammenligning med andre tabellformater
- Partisjonering og skjemautvikling
- Tidsreise og dataversjonering
Oppsett av Apache Iceberg
- Installasjon og konfigurering
- Integrering av Iceberg med forskjellige data-behandlingsmotor
- Oppsett av en Iceberg-miljø på en lokal maskin
Grunnleggende operasjoner
- Oppretting og administrasjon av Iceberg-tabeller
- Skriving til og lesing fra Iceberg-tabeller
- Grunnleggende CRUD-operasjoner
Datamigrasjon og integrasjon
- Migrasjon av data fra Hive og andre systemer til Iceberg
- Integrering med BI-verktøy
- Migrasjon av et eksempel-dataset til Iceberg
Optimalisering av ytelse
- Ytelsestilpasningsteknikker
- Optimalisering av spørringer og data-scanning
- Ytelsesoptimalisering i Iceberg
Oversikt over avanserte funksjoner
- Partisjonsutvikling og skjult partisjonering
- Tabellutvikling og skjemendringer
- Tidsreise og tilbakestillingsfunksjoner
- Implementering av avanserte funksjoner i Iceberg
Oppsummering og neste steg
Krav
- Kjennskap med konsepter som tabeller, skjemaer, partisjoner og data-inntak
- Grunnleggende kunnskap i SQL
Målgruppe
- Dataingeniører
- Dataarkitekter
- Dataanalytikere
- Programvareutviklere
14 Timer
Referanser (5)
De live-eksemplene
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskinoversatt
meget interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskinoversatt
Nokkel praktisk erfaring, instruktøren er kunnskapsrik
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maskinoversatt
Få muligheten til å lære Spark Streaming, Databricks og AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maskinoversatt
øvelseoppgaver
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maskinoversatt