Kursplan

Dag én: Grunnleggende språk

    Kursintroduksjon Om Data Science Data Science Definisjonsprosessen Data Science.
Vi introduserer R Language
  • Variabler og typer
  • Kontrollstrukturer (løkker / betingelser)
  • R Scalars, vektorer og matriser som definerer R-vektorer
  • Matriser
  • Datatype for streng- og tekstmanipulering
  • IO filer
  • Lister
  • Funksjoner Introduserer funksjoner
  • Nedleggelser
  • lapply/sapply-funksjoner
  • Datarammer
  • Labs for alle seksjoner
  • Dag to: Middels R Programming
  • DataFrames og fil-I/O Lese data fra filer Dataforberedelse Innebygde datasett Visualisering Grafikk Pakkeplott() / barplot() / hist() / boxplot() / spredningsplott Heat Map ggplot2-pakke (qplot(), ggplot())
  • Utforskning med Dplyr
  • Labs for alle seksjoner
  • Dag tre: Avansert Programming Med R

      Statistisk modellering med R Statistiske funksjoner som håndterer NA-fordelinger (binomial, poisson, normal)
    Regresjon Introduserer lineære regresjoner
  • Anbefalinger
  • Tekstbehandling (tm-pakke / Wordskyer)
  • Clustering Introduksjon til Clustering

      KMeans
    Klassifisering Introduksjon til klassifisering
  • Naiv Bayes
  • Beslutningstrær
  • Trening med caret-pakke
  • Evaluering av algoritmer
  • R og Big Data Kobler R til databaser
  • Big Data Økosystem
  • Labs for alle seksjoner

    Krav

    • Grunnleggende programmeringsbakgrunn foretrekkes

    Oppsett

    • En moderne bærbar PC
    • Siste R studio og R miljø installert
     21 timer

    Antall deltakere



    Price per participant

    Testimonials (5)

    Related Categories