Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.
Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.
Kursplan
Introduksjon
- Forstå viktigheten av dataforberedelse i analyse og maskinlæringsprosesser
- Dataforberedelses-pipeline og dens rolle i data-livsyklusen
- Utforskning av vanlige utfordringer i rådata og deres innvirkning på analysen
Datainnsamling og -tilgang
- Kilder til data: databaser, API-er, regneark, tekstfiler og mer
- Teknikker for innsamling av data og sikring av datakvalitet under innsamlingen
- Innsamling av data fra ulike kilder
Teknikker for rensing av data
- Identifisering og håndtering av manglende verdier, utliggere og uoverensstemmelser
- Håndtering av duplikater og feil i datasettet
- Rensing av virkelige datasett
Data-transformasjon og standardisering
- Teknikker for data-normalisering og -standardisering
- Håndtering av kategorisk data: koding, binning og feature engineering
- Transformering av rådata til brukbare formater
Dataintegrasjon og aggregasjon
- Sammenføyning og kombinasjon av datasett fra ulike kilder
- Løsning av data-konflikter og justering av datatyper
- Teknikker for data-aggregasjon og konsolidering
Data-kvalitetssikring
- Metoder for å sikre data-kvalitet og -integritet gjennom hele prosessen
- Implementering av kvalitetskontroller og valideringsprosedyrer
- Tilfeller og praktiske anvendelser av data-kvalitetssikring
Dimensjonredusering og feature-seleksjon
- Forstå behovet for dimensjonreduksjon
- Teknikker som PCA, feature-seleksjon og reduksjonsstrategier
- Implementering av dimensjonreduksjonsteknikker
Oppsummering og neste skritt
Krav
- Grunnleggende forståelse av datakonsepter
Målgruppe
- Dataanalytikere
- Databasedministratorer
- IT-profesjonelle
14 timer
Referanser (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Kurs - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.