Kursplan

Introduksjon

Installasjon og konfigurasjon av Dataiku Data Science Studio (DSS)

  • Systemkrav for Dataiku DSS
  • Oppsett av Apache Hadoop og Apache Spark-integrasjoner
  • Konfigurer Dataiku DSS med web-proxyer
  • Migrering fra andre plattformer til Dataiku DSS

Oversikt over Dataiku DSS-funksjoner og arkitektur

  • Kjerneobjekter og grafer grunnleggende for Dataiku DSS
  • Hva er en oppskrift i Dataiku DSS?
  • Typer datamengder støttet av Dataiku DSS

Oppretting av et Dataiku DSS-prosjekt

Definering av datamengder for tilkobling til dataressurser i Dataiku DSS

  • Arbeid med DSS-koblinger og filformater
  • Standard DSS-formater mot Hadoop-spesifikke formater
  • Opplasting av filer for et Dataiku DSS-prosjekt

Oversikt over serverfilsystemet i Dataiku DSS

Oppretting og bruk av administrerte mapper

  • Dataiku DSS-oppskrift for sammenføyningsmappe
  • Lokale mot ikke-lokale administrerte mapper

Oppretting av et filsystemsdataset ved hjelp av innhold i administrerte mapper

  • Utføring av rengjøring med en DSS-kodeoppskrift

Arbeid med metrikkdatasett og internt statistikkdatasett

Implementering av DSS nedlastningsoppskrift for HTTP-datasett

Flytting av SQL-datasett og HDFS-datasett ved hjelp av DSS

Sortering av datasett i Dataiku DSS

  • Skriver-sortering mot lesetids-sortering

Undersøkelse og forberedelse av data-visualiseringer for et Dataiku DSS-prosjekt

Oversikt over Dataiku-skjemaer, lagringsformer og betydninger

Utføring av data-rensing, normalisering og berikningskoder i Dataiku DSS

Arbeid med Dataiku DSS-diagramgrensesnitt og typer visuelle aggregater

Bruk av den interaktive statistikkfunksjonen i DSS

  • Univariat analyse mot bivariat analyse
  • Bruk av DSS-verktyet for hovedkomponentanalyse (PCA)

Oversikt over maskinlæring med Dataiku DSS

  • Overvåket ML mot uovervåket ML
  • Referanser for DSS ML-algoritmer og egenskaper for behandling
  • Dyp læringsmaskin med Dataiku DSS

Oversikt over flyt som er avledet fra DSS-datasett og oppskrifter

Transformasjon av eksisterende datasett i DSS med visuelle oppskrifter

Bruk av DSS-oppskrifter basert på brukerdefinert kode

Optimalisering av kodeutforskning og eksperimentering med DSS-kodehefter

Skriving av avanserte DSS-visualiseringer og tilpassede frontend-funksjoner med Webapps

Arbeid med Dataiku DSS kode-rapporteringsfunksjon

Deling av dataprojektelementer og kjentgjøring med DSS-dashboard

Design og pakking av et Dataiku DSS-prosjekt som en gjenbrukbar applikasjon

Oversikt over avanserte metoder i Dataiku DSS

  • Implementering av optimalisert datasett-partisjonering ved hjelp av DSS
  • Utføring av spesifikke DSS-behandlingsdeler gjennom beregninger i Kubernetes-kontainere

Oversikt over samarbeid og versjonskontroll i Dataiku DSS

Implementering av automatiserte scenarier, metrikker og kontroller for DSS-prosjekttesting

Utplassering og oppdatering av et prosjekt med DSS-automasjonsnoden og pakker

Arbeid med sanntids-APIer i Dataiku DSS

  • Ekstra APIer og Rest APIer i DSS

Analysering og fremskrivning av Dataiku DSS tidsserier

Sikring av et prosjekt i Dataiku DSS

  • Administrasjon av prosjektrettigheter og dashboard-autorisasjoner
  • Implementering av avanserte sikkerhetsvalg

Integrering av Dataiku DSS med Skyen

Feilsøking

Sammendrag og konklusjon

Krav

  • Erfaring med Python, SQL og R programmeringsspråk
  • Grunnleggende kunnskap om datahåndtering med Apache Hadoop og Spark
  • Forståelse av maskinlæringskonsepter og datamodeller
  • Bakgrunn i statistisk analyse og datavitenskapskonsepter
  • Erfaring med visualisering og kommunikasjon av data

Målgruppe

  • Ingeniører
  • Data Scientists
  • Data Analysts
 21 timer

Antall deltakere


Price per participant

Upcoming Courses

Related Categories