Kursplan
Introduksjon
Installere og konfigurere Dataiku Data Science Studio (DSS)
- Systemkrav for Dataiku DSS Sette opp Apache Hadoop og Apache Spark-integrasjoner Konfigurere Dataiku DSS med nettproxyer Migrere fra andre plattformer til Dataiku DSS
Oversikt over Dataiku DSS-funksjoner og arkitektur
- Kjerneobjekter og grafer grunnleggende for Dataiku DSS Hva er en oppskrift i Dataiku DSS? Datasetttyper som støttes av Dataiku DSS
Opprette et Dataiku DSS-prosjekt
Definere datasett for å koble til dataressurser i Dataiku DSS
- Arbeide med DSS-koblinger og filformater Standard DSS-formater kontra Hadoop-spesifikke formater Laste opp filer for et Dataiku DSS-prosjekt
Oversikt over serverfilsystemet i Dataiku DSS
Opprette og bruke administrerte mapper
- Dataiku DSS-oppskrift for sammenslåingsmappe Lokale vs ikke-lokale administrerte mapper
Konstruere et filsystemdatasett ved å bruke administrert mappeinnhold
- Utføre oppryddinger med en DSS-kodeoppskrift
Arbeid med Metrics Dataset og Intern Stats Dataset
Implementering av DSS-nedlastingsoppskriften for HTTP-datasett
Flytting av SQL datasett og HDFS-datasett ved bruk av DSS
Bestilling av datasett i Dataiku DSS
- Forfatterbestilling vs lesetidsbestilling
Utforsking og forberedelse av databilder for et Dataiku DSS-prosjekt
Oversikt over Dataiku-skjemaer, lagringstyper og betydninger
Utføre skript for datarensing, normalisering og berikelse i Dataiku DSS
Arbeide med Dataiku DSS Charts Interface og typer visuelle aggregasjoner
Bruke den interaktive Statistics funksjonen til DSS
- Univariat analyse vs bivariat analyse Bruk av Principal Component Analysis (PCA) DSS-verktøyet
Oversikt over Machine Learning med Dataiku DSS
- Overvåket ML vs uovervåket ML Referanser for DSS ML-algoritmer og funksjonshåndtering Deep Learning med Dataiku DSS
Oversikt over flyten hentet fra DSS-datasett og -oppskrifter
Transformering av eksisterende datasett i DSS med visuelle oppskrifter
Bruke DSS-oppskrifter basert på brukerdefinert kode
Optimalisering av kodeutforskning og -eksperimentering med DSS-kodenotatbøker
Skrive avanserte DSS-visualiseringer og tilpassede grensesnittfunksjoner med webapper
Arbeide med Dataiku DSS-koderapportfunksjon
Dele dataprosjekter Element og bli kjent med DSS Dashboard
Designe og pakke et Dataiku DSS-prosjekt som en gjenbrukbar applikasjon
Oversikt over avanserte metoder i Dataiku DSS
- Implementering av optimaliserte datasettpartisjonering ved bruk av DSS. Utføre spesifikke DSS-behandlingsdeler gjennom beregninger i Kubernetes containere
Oversikt over Collaboration og versjonskontroll i Dataiku DSS
Implementering av automatiseringsscenarier, beregninger og kontroller for DSS-prosjekttesting
Distribuere og oppdatere et prosjekt med DSS Automation Node og Bundles
Arbeide med sanntids-APIer i Dataiku DSS
- Ytterligere APIer og Rest APIer i DSS
Analyse og Forecasting Dataiku DSS Time Series
Sikre et prosjekt i Dataiku DSS
- Administrere prosjekttillatelser og dashbordautorisasjoner Implementering av avanserte sikkerhetsalternativer
Integrering av Dataiku DSS med skyen
Feilsøking
Oppsummering og konklusjon
Krav
- Erfaring med programmeringsspråkene Python, SQL og R
- Grunnleggende kunnskap om databehandling med Apache Hadoop og Spark
- Forståelse av maskinlæringskonsepter og datamodeller
- Bakgrunn i statistiske analyser og datavitenskapelige konsepter
- Erfaring med å visualisere og kommunisere data
Publikum
- Ingeniører
- Dataforskere
- Dataanalytikere