Data Vault: Building a Scalable Data Warehouse Treningskurs
Data Vault Modeling er en databasemodelleringsteknikk som gir langsiktig historisk lagring av data som stammer fra flere kilder. Et datahvelv lagrer en enkelt versjon av fakta, eller "alle data, hele tiden". Den fleksible, skalerbare, konsistente og tilpasningsdyktige designen omfatter de beste aspektene ved 3. normalform (3NF) og stjerneskjema.
I denne instruktørledede, live-opplæringen vil deltakerne lære hvordan man bygger en Data Vault.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå arkitekturen og designkonseptene bak Data Vault 2.0, og dets interaksjon med Big Data, NoSQL og AI. Bruk datahvelvteknikker for å aktivere revisjon, sporing og inspeksjon av historiske data i et datavarehus. Utvikle en konsistent og repeterbar ETL (Extract, Transform, Load) prosess. Bygg og distribuer svært skalerbare og repeterbare varehus.
Format på kurset
- Del forelesning, del diskusjon, øvelser og tung praktisk praksis
Kursplan
Introduksjon
- Manglene ved eksisterende datavarehus-datamodelleringsarkitekturer Fordeler med Data Vault-modellering
Oversikt over Data Vault arkitektur og designprinsipper
- SEI / CMM / Samsvar
Data Vault søknader
- Dynamic Data Warehousing Exploration Warehousing In-Database Data Mining Rask kobling av ekstern informasjon
Data Vault komponenter
- Huber, lenker, satellitter
Bygge en Data Vault
Modelleringshuber, koblinger og satellitter
Data Vault referanseregler
Hvordan komponenter samhandler med hverandre
Modellering og fylling av en Data Vault
Konvertering av 3NF OLTP til en Data Vault Enterprise Data Warehouse (EDW)
Forstå lastedatoer, sluttdatoer og sammenføyningsoperasjoner
Business nøkler, relasjoner, lenketabeller og sammenføyningsteknikker
Spørreteknikker
Lastebehandling og spørringsbehandling
Oversikt over Matrix Metodikk
Få data inn i dataenheter
Laster Hub-enheter
Laster koblingsenheter
Laster satellitter
Bruke SEI/CMM nivå 5-maler for å oppnå repeterbare, pålitelige og kvantifiserbare resultater
Utvikle en konsistent og repeterbar ETL (Extract, Transform, Load) prosess
Bygge og distribuere svært skalerbare og repeterbare varehus
Avsluttende bemerkninger
Krav
- En forståelse av datavarehuskonsepter
- En forståelse av database- og datamodelleringskonsepter
Publikum
- Datamodellere
- Datavarehusspesialist
- Business Intelligence-spesialister
- Dataingeniører
- Database administratorer
Open Training Courses require 5+ participants.
Data Vault: Building a Scalable Data Warehouse Treningskurs - Booking
Data Vault: Building a Scalable Data Warehouse Treningskurs - Enquiry
Data Vault: Building a Scalable Data Warehouse - Consultancy Enquiry
Testimonials (1)
how the trainor shows his knowledge in the subject he's teachign
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Kurs - Data Vault: Building a Scalable Data Warehouse
Upcoming Courses
Relaterte kurs
Knowledge Discovery in Databases (KDD)
21 timerKunnskapsoppdagelse i databaser (KDD) er prosessen med å oppdage nyttig kunnskap fra en innsamling av data. Real-life applikasjoner for denne data mining teknikken inkluderer markedsføring, svindeldeteksjon, telekommunikasjon og produksjon.
I denne instruktørledede, levende kurset introduserer vi prosessene involvert i KDD og utfører en rekke øvelser for å praktisere implementeringen av disse prosessene.
Publikum
- Dataanalytikere eller noen som er interessert i å lære hvordan å tolke data for å løse problemer
Format av kurset
- Etter en teoretisk diskusjon om KDD, vil instruktøren presentere real-life tilfeller som krever at anvendelsen av KDD for å løse et problem. Deltakerne vil forberede, velge og rengjøre mønsterdata sett og bruke sin fortidige kunnskap om dataene for å foreslå løsninger basert på resultatene av sine observasjoner.
Statistics with SPSS Predictive Analytics Software
14 timerGo :
Lære å jobbe med SPSS på nivå med uavhengighet
Adressatene:
Analytikere, forskere, forskere, studenter og alle de som ønsker å tilegne seg muligheten til å bruke SPSS-pakken og lære populære data mining-teknikker.
Data Mining
21 timerKurset kan leveres med alle verktøy, inkludert gratis programvare og applikasjoner for datautvinning med åpen kildekode
From Data to Decision with Big Data and Predictive Analytics
21 timerPublikum
Hvis du prøver å være fornuftig ut fra dataene du har tilgang til eller ønsker å analysere ustrukturerte data tilgjengelig på nettet (som Twitter, koblet inn osv.), Er dette kurset noe for deg.
Det er mest rettet mot beslutningstakere og personer som trenger å velge hvilke data som er verdt å samle inn og hva som er verdt å analysere.
Det er ikke rettet mot folk som konfigurerer løsningen, de menneskene vil dra nytte av det store bildet.
Leveringsmodus
I løpet av kurset vil delegatene bli presentert med fungerende eksempler på stort sett åpen kildekode-teknologier.
Korte forelesninger blir fulgt av presentasjon og enkle øvelser av deltakerne
Innhold og programvare brukt
All programvare som brukes oppdateres hver gang kurset kjøres, så vi sjekker de nyeste versjonene som er mulig.
Den dekker prosessen fra innhenting, formatering, behandling og analyse av dataene, for å forklare hvordan man kan automatisere beslutningsprosesser med maskinlæring.
Data Mining with R
14 timerR er et gratis programmeringsspråk med åpen kildekode for statistisk databehandling, dataanalyse og grafikk. R brukes av et økende antall ledere og dataanalytikere i selskaper og akademia. R har et bredt utvalg av pakker for data mining.
Oracle SQL Intermediate - Data Extraction
14 timerMålet med kurset er å gjøre deltakerne i stand til å mestre hvordan man arbeider med SQL språket i Oracle database for datautvinning på mellomnivå.
Data Mining and Analysis
28 timerObjektiv:
Delegater kan analysere store datasett, trekke ut mønstre, velge riktig variabel som påvirker resultatene, slik at en ny modell forutses med prediktive resultater.
Introductory R for Biologists
28 timerR er et gratis programmeringsspråk med åpen kildekode for statistisk databehandling, dataanalyse og grafikk. R brukes av et økende antall ledere og dataanalytikere i selskaper og akademia. R har også funnet tilhengere blant statistikere, ingeniører og forskere uten dataprogrammeringsevner som synes det er enkelt å bruke. Dens popularitet skyldes den økende bruken av data mining for forskjellige mål, for eksempel angitte annonsepriser, finne nye medisiner raskere eller finjustere økonomiske modeller. R har et bredt utvalg av pakker for data mining.
Data Mining & Machine Learning with R
14 timerR er et gratis programmeringsspråk med åpen kildekode for statistisk databehandling, dataanalyse og grafikk. R brukes av et økende antall ledere og dataanalytikere i selskaper og akademia. R har et bredt utvalg av pakker for data mining.
Data Visualization
28 timerDette kurset er beregnet på ingeniører og beslutningstakere som arbeider innen data mining og knoweldge-funn.
Du lærer hvordan du lager effektive tomter og måter å presentere og representere dataene dine på på en måte som vil appellere til beslutningstakerne og hjelpe dem til å forstå skjult informasjon.
Data Science for Big Data Analytics
35 timerBig data er datasett som er så omfangsrike og komplekse at tradisjonell databehandlingsapplikasjonsprogramvare er utilstrekkelig til å håndtere dem. Store datautfordringer inkluderer innhenting av data, datalagring, dataanalyse, søk, deling, overføring, visualisering, spørring, oppdatering og informasjon om personvern.
Process Mining
21 timerProcess mining, eller Automated Business Process Discovery (ABPD), er en teknikk som bruker algoritmer til hendelseslogger for å analysere forretningsprosesser. Prosessbryting går utover datalagring og dataanalyse; den broer mellom data med prosesser og gir innsikt i trender og mønstre som påvirker prosesseffektiviteten.
Kursets format
- Kurset starter med en oversikt over de mest brukte teknikkene for prosess gruvedrift. Vi diskuterer de forskjellige prosessoppdagelsesalgoritmer og verktøy som brukes for å oppdage og modellere prosesser basert på rå hendelsesdata. Real-case case-studier blir undersøkt og datasett blir analysert ved hjelp av ProM open source framework.
MATLAB for Financial Applications
21 timerMATLAB er et numerisk datamiljø og programmeringsspråk utviklet av MathWorks.
MonetDB
28 timerMonetDB er en åpen kildekode-database som var banebrytende for kolonnebutikkteknologien.
I denne instruktørledede, live-opplæringen vil deltakerne lære hvordan de bruker MonetDB og hvordan de får mest mulig ut av det.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå MonetDB og dets funksjoner Installer og kom i gang med MonetDB Utforsk og utfør forskjellige funksjoner og oppgaver i MonetDB Fremskynd leveringen av prosjektet deres ved å maksimere MonetDB evner
Publikum
- Utviklere Tekniske eksperter
Format på kurset
- Del forelesning, del diskusjon, øvelser og tung praktisk praksis
Foundation R
7 timerMålet med kurset er å gjøre det mulig for deltakerne å få en mestring av grunnleggende forhold i R og hvordan de kan jobbe med data.