Kursplan

Introduksjon

    Data Science Prosessrollene og -ansvaret til en dataforsker

Forberede utviklingsmiljøet

    Biblioteker, rammer, språk og verktøy Lokal utvikling Samarbeidende nettbasert utvikling

Datainnsamling

    Ulike typer datastrukturerte lokale databaser Databasekoblinger Vanlige formater: xlxs, XML, Json, csv, ...
Ustrukturerte klikk, sensurer, smarttelefoner
  • APIer
  • Internet of Things (IoT)
  • Dokumenter, bilder, videoer, lyder
  • Kasusstudie: Innsamling av store mengder ustrukturert data kontinuerlig
  • DatalagringRelasjonsdatabaser Ikke-relasjonelle databaser Hadoop: Distribuert filsystem (HDFS) Spark: Resilient Distributed Dataset (RDD) Skylagring
  • Dataforberedelse
  • Svelging, utvalg, rensing og transformasjon Sikre datakvalitet - korrekthet, meningsfullhet og sikkerhet Unntaksrapporter

      Languages brukes til forberedelse, prosessering og analyse

    R språk Introduksjon til R Datamanipulering, beregning og grafisk visning

      Python Introduksjon til Python

    Manipulere, behandle, rense og knuse data

      Dataanalyse
    Utforskende analyse Grunnleggende statistikk Utkast til visualiseringer Forstå data
  • Kausalitet
  • Funksjoner og transformasjoner
  • Machine Learning Overvåket vs uovervåket

      Når du skal bruke hvilken modell
    Natural Language Processing (NLP)
  • Data Visualization
  • Beste praksis Velge riktig diagram for riktig data Fargepaller Ta det til neste nivå Dashboards Interaktive visualiseringer
  • Historiefortelling med data
  • Oppsummering og konklusjon
  • Krav

    • En generell forståelse av databasekonsepter
    • En grunnleggende forståelse av statistikk
     35 timer

    Antall deltakere



    Price per participant

    Testimonials (1)

    Related Categories