Kursplan
Innføring i DataStage
- Oversikt over ETL-prosessen
- Forståelse av DataStage-arkitekturen
- Nøkkelsystemer i DataStage
Administrasjon av DataStage
- Installasjon og konfigurasjon
- Bruker- og sikkerhetsadministrasjon
- Prosjektoppsett og miljøadministrasjon
- Jobbskjedulering og administrasjon
- Sikkerhetskopierings- og gjenopprettingsprosedyrer
Datahentingsteknikker
- Koble til ulike datasystemer
- Hente ut data fra databaser, flat filer og eksterne kilder
- Best praksis for datahenting
Datatransformasjon med DataStage
- Forståelse av DataStage-designer
- Arbeide med ulike stagetyper
- Implementering av business logikk i transformasjoner
- Avanserte teknikker for datatransformasjon
Datainnlasting og integrasjon
- Last inn data til målsystemer
- Sikre datakvalitet og integritet
- Feilhåndtering og logging
Prestasjontuning og optimering
- Best praksis for prestasjonstuning
- Resurshåndtering
- Jobbsekvensiering og parallelle kjøring
Avanserte emner
- Arbeide med DataStage director
- Feilsøking og feilretting
Oppsummering og neste skritt
Krav
- Grunnleggende forståelse av databasematematiske konsepter
- Bekjenthet med SQL og datawarehouse-prinsipper
Målgruppe
- IT-professionelle
- Databasadministratører
- Utviklere
Referanser (5)
De live-eksemplene
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskinoversatt
meget interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskinoversatt
Nokkel praktisk erfaring, instruktøren er kunnskapsrik
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maskinoversatt
Få muligheten til å lære Spark Streaming, Databricks og AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maskinoversatt
øvelseoppgaver
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maskinoversatt