Data Mining & Machine Learning with R Treningskurs
R er et gratis programmeringsspråk med åpen kildekode for statistisk databehandling, dataanalyse og grafikk. R brukes av et økende antall ledere og dataanalytikere i selskaper og akademia. R har et bredt utvalg av pakker for data mining.
Kursplan
Introduksjon til datautvinning og Machine Learning
- Statistisk læring vs. maskinlæring
- Iterasjon og evaluering
- Avveining mellom skjevhet og variasjon
Regresjon
- Lineær regresjon
- Generaliseringer og ikke-linearitet
- Øvelser
Klassifisering
- Bayesiansk oppfriskning
- Naiv Bayes
- Diskriminerende analyse
- Logistisk regresjon
- K-Nærmeste naboer
- Støtte vektormaskiner
- Nevrale nettverk
- Beslutningstrær
- Øvelser
Kryssvalidering og resampling
- Kryssvalideringsmetoder
- Bootstrap
- Øvelser
Uovervåket læring
- K-betyr gruppering
- Eksempler
- Utfordringer ved uovervåket læring og utover K-midler
Avanserte emner
- Ensemblemodeller
- Blandede modeller
- Forsterkning
- Eksempler
Flerdimensjonal reduksjon
- Faktor analyse
- Hovedkomponentanalyse
- Eksempler
Krav
Dette kurset er en del av ferdighetssettet Data Scientist (Domene: Analytiske teknikker og metoder)
Open Training Courses require 5+ participants.
Data Mining & Machine Learning with R Treningskurs - Booking
Data Mining & Machine Learning with R Treningskurs - Enquiry
Data Mining & Machine Learning with R - Consultancy Enquiry
Testimonials (1)
The trainer was so knowledgeable and included areas I was interested in.
Mohamed Salama
Kurs - Data Mining & Machine Learning with R
Upcoming Courses
Relaterte kurs
Knowledge Discovery in Databases (KDD)
21 timerKunnskapsoppdagelse i databaser (KDD) er prosessen med å oppdage nyttig kunnskap fra en innsamling av data. Real-life applikasjoner for denne data mining teknikken inkluderer markedsføring, svindeldeteksjon, telekommunikasjon og produksjon.
I denne instruktørledede, levende kurset introduserer vi prosessene involvert i KDD og utfører en rekke øvelser for å praktisere implementeringen av disse prosessene.
Publikum
- Dataanalytikere eller noen som er interessert i å lære hvordan å tolke data for å løse problemer
Format av kurset
- Etter en teoretisk diskusjon om KDD, vil instruktøren presentere real-life tilfeller som krever at anvendelsen av KDD for å løse et problem. Deltakerne vil forberede, velge og rengjøre mønsterdata sett og bruke sin fortidige kunnskap om dataene for å foreslå løsninger basert på resultatene av sine observasjoner.
Introduction to Data Visualization with Tidyverse and R
7 timerTidyverse er en samling allsidige R-pakker for rengjøring, prosessering, modellering og visualisering av data. Noen av pakkene som er inkludert er: ggplot2, dplyr, tidyr, readr, purrr og tibble.
I denne instruktørledede Tidyverse vil deltakerne lære å manipulere og visualisere data ved hjelp av verktøyene som er inkludert i Tidyverse .
Ved slutten av denne opplæringen vil deltakerne kunne:
- Utfør dataanalyse og lag tiltalende visualiseringer
- Tegn nyttige konklusjoner fra forskjellige datasett med eksempeldata
- Filtrer, sorter og oppsummer data for å svare på utforskende spørsmål
- Gjør behandlet data til informative linjediagrammer, søylediagrammer, histogrammer
- Importer og filtrer data fra forskjellige datakilder, inkludert Excel , CSV- og SPSS-filer
Publikum
- Nybegynnere til R-språket
- Nybegynnere til dataanalyse og datavisualisering
Kursets format
- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse
Statistics with SPSS Predictive Analytics Software
14 timerGo :
Lære å jobbe med SPSS på nivå med uavhengighet
Adressatene:
Analytikere, forskere, forskere, studenter og alle de som ønsker å tilegne seg muligheten til å bruke SPSS-pakken og lære populære data mining-teknikker.
Data Mining
21 timerKurset kan leveres med alle verktøy, inkludert gratis programvare og applikasjoner for datautvinning med åpen kildekode
From Data to Decision with Big Data and Predictive Analytics
21 timerPublikum
Hvis du prøver å være fornuftig ut fra dataene du har tilgang til eller ønsker å analysere ustrukturerte data tilgjengelig på nettet (som Twitter, koblet inn osv.), Er dette kurset noe for deg.
Det er mest rettet mot beslutningstakere og personer som trenger å velge hvilke data som er verdt å samle inn og hva som er verdt å analysere.
Det er ikke rettet mot folk som konfigurerer løsningen, de menneskene vil dra nytte av det store bildet.
Leveringsmodus
I løpet av kurset vil delegatene bli presentert med fungerende eksempler på stort sett åpen kildekode-teknologier.
Korte forelesninger blir fulgt av presentasjon og enkle øvelser av deltakerne
Innhold og programvare brukt
All programvare som brukes oppdateres hver gang kurset kjøres, så vi sjekker de nyeste versjonene som er mulig.
Den dekker prosessen fra innhenting, formatering, behandling og analyse av dataene, for å forklare hvordan man kan automatisere beslutningsprosesser med maskinlæring.
Data Mining with R
14 timerR er et gratis programmeringsspråk med åpen kildekode for statistisk databehandling, dataanalyse og grafikk. R brukes av et økende antall ledere og dataanalytikere i selskaper og akademia. R har et bredt utvalg av pakker for data mining.
Oracle SQL Intermediate - Data Extraction
14 timerMålet med kurset er å gjøre deltakerne i stand til å mestre hvordan man arbeider med SQL språket i Oracle database for datautvinning på mellomnivå.
Data Mining and Analysis
28 timerObjektiv:
Delegater kan analysere store datasett, trekke ut mønstre, velge riktig variabel som påvirker resultatene, slik at en ny modell forutses med prediktive resultater.
Introductory R for Biologists
28 timerR er et gratis programmeringsspråk med åpen kildekode for statistisk databehandling, dataanalyse og grafikk. R brukes av et økende antall ledere og dataanalytikere i selskaper og akademia. R har også funnet tilhengere blant statistikere, ingeniører og forskere uten dataprogrammeringsevner som synes det er enkelt å bruke. Dens popularitet skyldes den økende bruken av data mining for forskjellige mål, for eksempel angitte annonsepriser, finne nye medisiner raskere eller finjustere økonomiske modeller. R har et bredt utvalg av pakker for data mining.
Data Visualization
28 timerDette kurset er beregnet på ingeniører og beslutningstakere som arbeider innen data mining og knoweldge-funn.
Du lærer hvordan du lager effektive tomter og måter å presentere og representere dataene dine på på en måte som vil appellere til beslutningstakerne og hjelpe dem til å forstå skjult informasjon.
Data Science for Big Data Analytics
35 timerBig data er datasett som er så omfangsrike og komplekse at tradisjonell databehandlingsapplikasjonsprogramvare er utilstrekkelig til å håndtere dem. Store datautfordringer inkluderer innhenting av data, datalagring, dataanalyse, søk, deling, overføring, visualisering, spørring, oppdatering og informasjon om personvern.
Process Mining
21 timerProcess mining, eller Automated Business Process Discovery (ABPD), er en teknikk som bruker algoritmer til hendelseslogger for å analysere forretningsprosesser. Prosessbryting går utover datalagring og dataanalyse; den broer mellom data med prosesser og gir innsikt i trender og mønstre som påvirker prosesseffektiviteten.
Kursets format
- Kurset starter med en oversikt over de mest brukte teknikkene for prosess gruvedrift. Vi diskuterer de forskjellige prosessoppdagelsesalgoritmer og verktøy som brukes for å oppdage og modellere prosesser basert på rå hendelsesdata. Real-case case-studier blir undersøkt og datasett blir analysert ved hjelp av ProM open source framework.
MATLAB for Financial Applications
21 timerMATLAB er et numerisk datamiljø og programmeringsspråk utviklet av MathWorks.
Data Vault: Building a Scalable Data Warehouse
28 timerI denne instruktørledede liveopplæringen i Norge vil deltakerne lære hvordan man bygger en Data Vault.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå arkitekturen og designkonseptene bak Data Vault 2.0, og dets interaksjon med Big Data, NoSQL og AI.
- Bruk datahvelvteknikker for å aktivere revisjon, sporing og inspeksjon av historiske data i et datavarehus.
- Utvikle en konsistent og repeterbar ETL (Extract, Transform, Load) prosess.
- Bygg og distribuer svært skalerbare og repeterbare varehus.
MonetDB
28 timerMonetDB er en åpen kildekode-database som var banebrytende for kolonnebutikkteknologien.
I denne instruktørledede, live-opplæringen vil deltakerne lære hvordan de bruker MonetDB og hvordan de får mest mulig ut av det.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå MonetDB og dets funksjoner Installer og kom i gang med MonetDB Utforsk og utfør forskjellige funksjoner og oppgaver i MonetDB Fremskynd leveringen av prosjektet deres ved å maksimere MonetDB evner
Publikum
- Utviklere Tekniske eksperter
Format på kurset
- Del forelesning, del diskusjon, øvelser og tung praktisk praksis