Kursplan

Introduksjon

Installere og konfigurere Dataiku Data Science Studio (DSS)

    Systemkrav for Dataiku DSS Sette opp Apache Hadoop og Apache Spark-integrasjoner Konfigurere Dataiku DSS med nettproxyer Migrere fra andre plattformer til Dataiku DSS

Oversikt over Dataiku DSS-funksjoner og arkitektur

    Kjerneobjekter og grafer grunnleggende for Dataiku DSS Hva er en oppskrift i Dataiku DSS? Datasetttyper som støttes av Dataiku DSS

Opprette et Dataiku DSS-prosjekt

Definere datasett for å koble til dataressurser i Dataiku DSS

    Arbeide med DSS-koblinger og filformater Standard DSS-formater kontra Hadoop-spesifikke formater Laste opp filer for et Dataiku DSS-prosjekt

Oversikt over serverfilsystemet i Dataiku DSS

Opprette og bruke administrerte mapper

    Dataiku DSS-oppskrift for sammenslåingsmappe Lokale vs ikke-lokale administrerte mapper

Konstruere et filsystemdatasett ved å bruke administrert mappeinnhold

    Utføre oppryddinger med en DSS-kodeoppskrift

Arbeid med Metrics Dataset og Intern Stats Dataset

Implementering av DSS-nedlastingsoppskriften for HTTP-datasett

Flytting av SQL datasett og HDFS-datasett ved bruk av DSS

Bestilling av datasett i Dataiku DSS

    Forfatterbestilling vs lesetidsbestilling

Utforsking og forberedelse av databilder for et Dataiku DSS-prosjekt

Oversikt over Dataiku-skjemaer, lagringstyper og betydninger

Utføre skript for datarensing, normalisering og berikelse i Dataiku DSS

Arbeide med Dataiku DSS Charts Interface og typer visuelle aggregasjoner

Bruke den interaktive Statistics funksjonen til DSS

    Univariat analyse vs bivariat analyse Bruk av Principal Component Analysis (PCA) DSS-verktøyet

Oversikt over Machine Learning med Dataiku DSS

    Overvåket ML vs uovervåket ML Referanser for DSS ML-algoritmer og funksjonshåndtering Deep Learning med Dataiku DSS

Oversikt over flyten hentet fra DSS-datasett og -oppskrifter

Transformering av eksisterende datasett i DSS med visuelle oppskrifter

Bruke DSS-oppskrifter basert på brukerdefinert kode

Optimalisering av kodeutforskning og -eksperimentering med DSS-kodenotatbøker

Skrive avanserte DSS-visualiseringer og tilpassede grensesnittfunksjoner med webapper

Arbeide med Dataiku DSS-koderapportfunksjon

Dele dataprosjekter Element og bli kjent med DSS Dashboard

Designe og pakke et Dataiku DSS-prosjekt som en gjenbrukbar applikasjon

Oversikt over avanserte metoder i Dataiku DSS

    Implementering av optimaliserte datasettpartisjonering ved bruk av DSS. Utføre spesifikke DSS-behandlingsdeler gjennom beregninger i Kubernetes containere

Oversikt over Collaboration og versjonskontroll i Dataiku DSS

Implementering av automatiseringsscenarier, beregninger og kontroller for DSS-prosjekttesting

Distribuere og oppdatere et prosjekt med DSS Automation Node og Bundles

Arbeide med sanntids-APIer i Dataiku DSS

    Ytterligere APIer og Rest APIer i DSS

Analyse og Forecasting Dataiku DSS Time Series

Sikre et prosjekt i Dataiku DSS

    Administrere prosjekttillatelser og dashbordautorisasjoner Implementering av avanserte sikkerhetsalternativer

Integrering av Dataiku DSS med skyen

Feilsøking

Oppsummering og konklusjon

Krav

  • Erfaring med programmeringsspråkene Python, SQL og R
  • Grunnleggende kunnskap om databehandling med Apache Hadoop og Spark
  • Forståelse av maskinlæringskonsepter og datamodeller
  • Bakgrunn i statistiske analyser og datavitenskapelige konsepter
  • Erfaring med å visualisere og kommunisere data

Publikum

  • Ingeniører
  • Dataforskere
  • Dataanalytikere
 21 timer

Antall deltakere



Price per participant

Relaterte kurs

Related Categories