Kursplan

Raskt Overblikk

    Datakilder Minding Data Recommender-systemer Mål Marketing

Datatyper

    Strukturert vs ustrukturert Statisk vs. strømmet holdnings-, atferds- og demografiske data Datadrevet vs brukerdrevet analysedatavaliditet Volum, hastighet og variasjon av data

Modeller

    Bygge modeller Statistiske modeller Maskinlæring

Dataklassifisering

    Gruppering av kGrupper, k-betyr, de nærmeste naboene Myrkolonier, fugler som flokker seg

Prediktive modeller

    Beslutningstre Støtte vektormaskin Naiv Bayes-klassifisering Nevrale nettverk Markov Modell Regresjon Ensemblemetoder

ROI

    Nytte/kostnadsforhold Kostnad for programvare Utviklingskostnader Potensielle fordeler

Bygge modeller

    Dataforberedelse (MapReduce) Datarensing Velge metoder Utvikle modell Teste modell Modellevaluering Modelldistribusjon og integrasjon

Oversikt over åpen kildekode og kommersiell programvare

    Valg av R-prosjektpakke Python biblioteker Hadoop og Mahout Utvalgte Apache-prosjekter relatert til Big Data og Analytics Utvalgt kommersiell løsning Integrasjon med eksisterende programvare og datakilder

Krav

Forståelse av tradisjonelle datahåndterings- og analysemetoder som SQL, datavarehus, business intelligence, OLAP, etc... Forståelse av grunnleggende statistikk og sannsynlighet (gjennomsnitt, varians, sannsynlighet, betinget sannsynlighet, etc...)

 21 timer

Antall deltakere



Price per participant

Testimonials (1)

Related Categories