Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.
Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.
Kursplan
Grunnleggende prinsipper for data warehousing
- Formål, komponenter og arkitektur for data warehousing
- Data marts, virksomhetsdatawarehouses og lakehouse-mønstre
- Grunnleggende prinsipper og arbeidsbelastningsadskillelse for OLTP og OLAP
Dimensjonell modellering
- Fakta, dimensjoner og korn
- Star schema vs snowflake schema
- Typer og håndtering av langsomt endrende dimensjoner
ETL- og ELT-prosesser
- Ekstraksjonsstrategier fra OLTP og API-er
- Transformasjoner, data rensing og overholdelse
- Laste mønstre, orchestering og avhengighetshåndtering
Data kvalitet og metadata-håndtering
- Data profilering og valideringsregler
- Avstemming av master- og referanse data
- Linje, kataloger og dokumentasjon
Analytikk og ytelse
- Kubemønstre, aggregater og materialiserte visninger
- Deling, klustering og indeksering for analytikk
- Arbeidsbelastningshåndtering, caching og spørringstuning
Sikkerhet og styring
- Tilgangskontroll, roller og radnivå-sikkerhet
- Overholdelsesoverveielser og revisjon
- Backup, gjenoppretting og pålitelige praksiser
Moderne arkitekturer
- Skybaserte datawarehouses og elastisitet
- Strøming av inntak og nærtidsanalytikk
- Kostnadsoptimalisering og overvåking
Hovedprojekt: Fra kilder til star schema
- Modellering av en forretningsprosess til fakta og dimensjoner
- Bygging av en helhetlig ETL- eller ELT-arbeidsflyt
- Publisering av dashboards og validering av metrikker
Oppsummering og neste steg
Krav
- En forståelse av relasjonsdatabaser og SQL
- Erfaring med dataanalyse eller rapportering
- Grundleggende kjennskap til sky- eller on-premises dataplattformer
Målgruppe
- Dataanalytikere som overgår til datalagring
- BI-utviklere og ETL-ingeniører
- Dataarkitekter og teamledere
35 timer
Referanser (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks