Kursplan
Introduksjon
Installasjon og konfigurasjon av Dataiku Data Science Studio (DSS)
- Systemkrav for Dataiku DSS
- Oppsett av Apache Hadoop og Apache Spark-integrasjoner
- Konfigurer Dataiku DSS med web-proxyer
- Migrering fra andre plattformer til Dataiku DSS
Oversikt over Dataiku DSS-funksjoner og arkitektur
- Kjerneobjekter og grafer grunnleggende for Dataiku DSS
- Hva er en oppskrift i Dataiku DSS?
- Typer datamengder støttet av Dataiku DSS
Oppretting av et Dataiku DSS-prosjekt
Definering av datamengder for tilkobling til dataressurser i Dataiku DSS
- Arbeid med DSS-koblinger og filformater
- Standard DSS-formater mot Hadoop-spesifikke formater
- Opplasting av filer for et Dataiku DSS-prosjekt
Oversikt over serverfilsystemet i Dataiku DSS
Oppretting og bruk av administrerte mapper
- Dataiku DSS-oppskrift for sammenføyningsmappe
- Lokale mot ikke-lokale administrerte mapper
Oppretting av et filsystemsdataset ved hjelp av innhold i administrerte mapper
- Utføring av rengjøring med en DSS-kodeoppskrift
Arbeid med metrikkdatasett og internt statistikkdatasett
Implementering av DSS nedlastningsoppskrift for HTTP-datasett
Flytting av SQL-datasett og HDFS-datasett ved hjelp av DSS
Sortering av datasett i Dataiku DSS
- Skriver-sortering mot lesetids-sortering
Undersøkelse og forberedelse av data-visualiseringer for et Dataiku DSS-prosjekt
Oversikt over Dataiku-skjemaer, lagringsformer og betydninger
Utføring av data-rensing, normalisering og berikningskoder i Dataiku DSS
Arbeid med Dataiku DSS-diagramgrensesnitt og typer visuelle aggregater
Bruk av den interaktive statistikkfunksjonen i DSS
- Univariat analyse mot bivariat analyse
- Bruk av DSS-verktyet for hovedkomponentanalyse (PCA)
Oversikt over maskinlæring med Dataiku DSS
- Overvåket ML mot uovervåket ML
- Referanser for DSS ML-algoritmer og egenskaper for behandling
- Dyp læringsmaskin med Dataiku DSS
Oversikt over flyt som er avledet fra DSS-datasett og oppskrifter
Transformasjon av eksisterende datasett i DSS med visuelle oppskrifter
Bruk av DSS-oppskrifter basert på brukerdefinert kode
Optimalisering av kodeutforskning og eksperimentering med DSS-kodehefter
Skriving av avanserte DSS-visualiseringer og tilpassede frontend-funksjoner med Webapps
Arbeid med Dataiku DSS kode-rapporteringsfunksjon
Deling av dataprojektelementer og kjentgjøring med DSS-dashboard
Design og pakking av et Dataiku DSS-prosjekt som en gjenbrukbar applikasjon
Oversikt over avanserte metoder i Dataiku DSS
- Implementering av optimalisert datasett-partisjonering ved hjelp av DSS
- Utføring av spesifikke DSS-behandlingsdeler gjennom beregninger i Kubernetes-kontainere
Oversikt over samarbeid og versjonskontroll i Dataiku DSS
Implementering av automatiserte scenarier, metrikker og kontroller for DSS-prosjekttesting
Utplassering og oppdatering av et prosjekt med DSS-automasjonsnoden og pakker
Arbeid med sanntids-APIer i Dataiku DSS
- Ekstra APIer og Rest APIer i DSS
Analysering og fremskrivning av Dataiku DSS tidsserier
Sikring av et prosjekt i Dataiku DSS
- Administrasjon av prosjektrettigheter og dashboard-autorisasjoner
- Implementering av avanserte sikkerhetsvalg
Integrering av Dataiku DSS med Skyen
Feilsøking
Sammendrag og konklusjon
Krav
- Erfaring med Python, SQL og R programmeringsspråk
- Grunnleggende kunnskap om datahåndtering med Apache Hadoop og Spark
- Forståelse av maskinlæringskonsepter og datamodeller
- Bakgrunn i statistisk analyse og datavitenskapskonsepter
- Erfaring med visualisering og kommunikasjon av data
Målgruppe
- Ingeniører
- Data Scientists
- Data Analysts