Kursplan

Raskt Overblikk

  Datakilder Minding Data Recommender-systemer Mål Marketing

Datatyper

  Strukturert vs ustrukturert Statisk vs. strømmet holdnings-, atferds- og demografiske data Datadrevet vs brukerdrevet analysedatavaliditet Volum, hastighet og variasjon av data

Modeller

  Bygge modeller Statistiske modeller Maskinlæring

Dataklassifisering

  Gruppering av kGrupper, k-betyr, de nærmeste naboene Myrkolonier, fugler som flokker seg

Prediktive modeller

  Beslutningstre Støtte vektormaskin Naiv Bayes-klassifisering Nevrale nettverk Markov Modell Regresjon Ensemblemetoder

ROI

  Nytte/kostnadsforhold Kostnad for programvare Utviklingskostnader Potensielle fordeler

Bygge modeller

  Dataforberedelse (MapReduce) Datarensing Velge metoder Utvikle modell Teste modell Modellevaluering Modelldistribusjon og integrasjon

Oversikt over åpen kildekode og kommersiell programvare

  Valg av R-prosjektpakke Python biblioteker Hadoop og Mahout Utvalgte Apache-prosjekter relatert til Big Data og Analytics Utvalgt kommersiell løsning Integrasjon med eksisterende programvare og datakilder

Krav

Forståelse av tradisjonelle datahåndterings- og analysemetoder som SQL, datavarehus, business intelligence, OLAP, etc... Forståelse av grunnleggende statistikk og sannsynlighet (gjennomsnitt, varians, sannsynlighet, betinget sannsynlighet, etc...)

 21 timer

Antall deltakerePrice per participant

Testimonials (1)

Related Categories