From Data to Decision with Big Data and Predictive Analytics Treningskurs
Publikum
Hvis du prøver å være fornuftig ut fra dataene du har tilgang til eller ønsker å analysere ustrukturerte data tilgjengelig på nettet (som Twitter, koblet inn osv.), Er dette kurset noe for deg.
Det er mest rettet mot beslutningstakere og personer som trenger å velge hvilke data som er verdt å samle inn og hva som er verdt å analysere.
Det er ikke rettet mot folk som konfigurerer løsningen, de menneskene vil dra nytte av det store bildet.
Leveringsmodus
I løpet av kurset vil delegatene bli presentert med fungerende eksempler på stort sett åpen kildekode-teknologier.
Korte forelesninger blir fulgt av presentasjon og enkle øvelser av deltakerne
Innhold og programvare brukt
All programvare som brukes oppdateres hver gang kurset kjøres, så vi sjekker de nyeste versjonene som er mulig.
Den dekker prosessen fra innhenting, formatering, behandling og analyse av dataene, for å forklare hvordan man kan automatisere beslutningsprosesser med maskinlæring.
Kursplan
Raskt Overblikk
- Datakilder Minding Data Recommender-systemer Mål Marketing
Datatyper
- Strukturert vs ustrukturert Statisk vs. strømmet holdnings-, atferds- og demografiske data Datadrevet vs brukerdrevet analysedatavaliditet Volum, hastighet og variasjon av data
Modeller
- Bygge modeller Statistiske modeller Maskinlæring
Dataklassifisering
- Gruppering av kGrupper, k-betyr, de nærmeste naboene Myrkolonier, fugler som flokker seg
Prediktive modeller
- Beslutningstre Støtte vektormaskin Naiv Bayes-klassifisering Nevrale nettverk Markov Modell Regresjon Ensemblemetoder
ROI
- Nytte/kostnadsforhold Kostnad for programvare Utviklingskostnader Potensielle fordeler
Bygge modeller
- Dataforberedelse (MapReduce) Datarensing Velge metoder Utvikle modell Teste modell Modellevaluering Modelldistribusjon og integrasjon
Oversikt over åpen kildekode og kommersiell programvare
- Valg av R-prosjektpakke Python biblioteker Hadoop og Mahout Utvalgte Apache-prosjekter relatert til Big Data og Analytics Utvalgt kommersiell løsning Integrasjon med eksisterende programvare og datakilder
Krav
Forståelse av tradisjonelle datahåndterings- og analysemetoder som SQL, datavarehus, business intelligence, OLAP, etc... Forståelse av grunnleggende statistikk og sannsynlighet (gjennomsnitt, varians, sannsynlighet, betinget sannsynlighet, etc...)
Open Training Courses require 5+ participants.
From Data to Decision with Big Data and Predictive Analytics Treningskurs - Booking
From Data to Decision with Big Data and Predictive Analytics Treningskurs - Enquiry
From Data to Decision with Big Data and Predictive Analytics - Consultancy Enquiry
Testimonials (2)
Innholdet, siden jeg fant det veldig interessant og tror det ville hjelpe meg i mitt siste år på universitetet.
Krishan - NBrown Group
Kurs - From Data to Decision with Big Data and Predictive Analytics
Machine Translated
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Kurs - From Data to Decision with Big Data and Predictive Analytics
Upcoming Courses
Relaterte kurs
Predictive AI in DevOps: Enhancing Software Delivery
14 timerDenne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot fagfolk på middels nivå DevOps som ønsker å integrere prediktiv AI i deres DevOps praksis.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Implementer prediktive analysemodeller for å forutsi og løse utfordringer i DevOps pipeline.
- Bruk AI-drevne verktøy for forbedret overvåking og drift.
- Bruk maskinlæringsteknikker for å forbedre arbeidsflyter for programvarelevering.
- Design AI-strategier for proaktiv problemløsning og optimalisering.
- Naviger i de etiske vurderingene ved bruk av kunstig intelligens i DevOps.
Introduction to Predictive AI
21 timerDenne instruktørledede, live-opplæringen i Norge (online eller på stedet) er rettet mot IT-fagfolk på nybegynnernivå som ønsker å forstå det grunnleggende i Predictive AI.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå kjernekonseptene til Predictive AI og dens applikasjoner.
- Samle, rengjør og forhåndsbehandle data for prediktiv analyse.
- Utforsk og visualiser data for å avdekke innsikt.
- Bygg grunnleggende statistiske modeller for å lage spådommer.
- Evaluer ytelsen til prediktive modeller.
- Bruk prediktive AI-konsepter på scenarier i den virkelige verden.
Data Vault: Building a Scalable Data Warehouse
28 timerI denne instruktørledede liveopplæringen i Norge vil deltakerne lære hvordan man bygger en Data Vault.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå arkitekturen og designkonseptene bak Data Vault 2.0, og dets interaksjon med Big Data, NoSQL og AI.
- Bruk datahvelvteknikker for å aktivere revisjon, sporing og inspeksjon av historiske data i et datavarehus.
- Utvikle en konsistent og repeterbar ETL (Extract, Transform, Load) prosess.
- Bygg og distribuer svært skalerbare og repeterbare varehus.
Spark Streaming with Python and Kafka
7 timerDenne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot dataingeniører, dataforskere og programmerere som ønsker å bruke Spark Streaming-funksjoner til å behandle og analysere sanntidsdata.
Ved slutten av denne opplæringen vil deltakerne kunne bruke Spark Streaming til å behandle live datastrømmer for bruk i databaser, filsystemer og live dashboards.
Confluent KSQL
7 timerDenne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot utviklere som ønsker å implementere Apache Kafka strømbehandling uten å skrive kode.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer Confluent KSQL.
- Sett opp en strømbehandlingspipeline med kun SQL-kommandoer (ingen Java- eller Python-koding).
- Utfør datafiltrering, transformasjoner, aggregeringer, sammenføyninger, vinduer og sesjonsisering i sin helhet i SQL.
- Design og distribuer interaktive, kontinuerlige spørringer for streaming av ETL og sanntidsanalyse.
Apache Ignite for Developers
14 timerDenne instruktørledede, live-opplæringen i Norge (online eller på stedet) er rettet mot utviklere som ønsker å lære prinsippene bak vedvarende og ren lagring i minnet mens de går gjennom opprettelsen av et eksempelprosjekt for in-memory databehandling.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Bruk Ignite for in-memory, on-disk persistens samt en rent distribuert in-memory database. Oppnå utholdenhet uten å synkronisere data tilbake til en relasjonsdatabase. Bruk Ignite til å utføre SQL og distribuerte sammenføyninger. Forbedre ytelsen ved å flytte data nærmere CPU, ved å bruke RAM som lagring. Spre datasett over en klynge for å oppnå horisontal skalerbarhet. Integrer Ignite med RDBMS, NoSQL, Hadoop og maskinlæringsprosessorer.
Unified Batch and Stream Processing with Apache Beam
14 timerApache Beam er en åpen kildekode, enhetlig programmeringsmodell for å definere og utføre parallelle databehandlingsrørledninger. Dens kraft ligger i dens evne til å kjøre både batch- og streaming-pipelines, med utførelse utført av en av Beams støttede distribuerte prosesserings-backends: Apache Apex, Apache Flink, Apache Spark og Google Cloud Dataflow. Apache Beam er nyttig for ETL-oppgaver (Extract, Transform and Load) som å flytte data mellom forskjellige lagringsmedier og datakilder, transformere data til et mer ønskelig format og laste inn data til et nytt system.
I denne instruktørledede, live-opplæringen (på stedet eller ekstern), vil deltakerne lære hvordan de implementerer Apache Beam SDK-ene i en Java- eller Python-applikasjon som definerer en databehandlingspipeline for å dekomponere et stort datasett i mindre biter for uavhengige, parallell behandling.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer Apache Beam. Bruk en enkelt programmeringsmodell for å utføre både batch- og strømbehandling fra Java- eller Python-applikasjonen deres. Utfør rørledninger på tvers av flere miljøer.
Kursets format
- Del forelesning, del diskusjon, øvelser og tung praktisk praksis
Merk
- Dette kurset vil være tilgjengelig Scala i fremtiden. Vennligst kontakt oss for å avtale.
Apache Apex: Processing Big Data-in-Motion
21 timerApache Apex er en YARN-innfødt plattform som forener strøm og batch-behandling. Den behandler store data-i-bevegelse på en måte som er skalerbar, performant, feiltolerant, tilstrekkelig, sikker, distribuert og lett å betjene.
Denne instruktørledede, liveopplæringen introduserer Apache Apex 'enhetlige strømbehandlingsarkitektur, og leder deltakerne gjennom opprettelsen av en distribuert applikasjon som bruker Apex på Hadoop .
Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå databehandlingsrørledningskonsepter som kontakter for kilder og vasker, vanlige datatransformasjoner, etc.
- Bygg, skaler og optimaliser et Apex-program
- Behandle datastrømmer i sanntid pålitelig og med minimum latens
- Bruk Apex Core og Apex Malhar-biblioteket for å muliggjøre rask applikasjonsutvikling
- Bruk Apex API for å skrive og bruke eksisterende Java kode på nytt
- Integrer Apex i andre applikasjoner som en prosessor
- Still inn, test og skaler Apex-applikasjoner
Kursets format
- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
Alternativer for tilpasning av kurset
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
Apache Storm
28 timerApache Storm er en distribuert, real-time datamaskin som brukes til å muliggjøre real-time forretningsintelligens. Det gjør det ved å tillate applikasjoner å pålitelig behandle ubegrensede datastrømmer (f.eks. forbruk av strømmen).
"Storm er for real-time bearbeiding hva Hadoop er for batch bearbeiding!"
I denne instruktørledede live-trening lærer deltakerne hvordan du installerer og konfigurerer Apache Storm, og deretter utvikler og implementerer en Apache Storm applikasjon for å behandle store data i sanntid.
Noen av temaene som er inkludert i denne treningen inkluderer:
- Apache Storm i sammenheng med Hadoop
- Arbeid med ubegrensede data
- Kontinuerlig beregning
- Real-time analyser
- Distribusjon av RPC og ETL
Be om dette kurset nå!
Publikum
- Programvare og ETL utviklere
- Mainframe fagfolk
- Data forskere
- Big data analytikere
- 0 0 Profesjonelle
Format av kurset
- Del forelesning, del diskusjon, øvelser og tung praksis
Apache NiFi for Administrators
21 timerI denne instruktørledede, live-opplæringen i Norge (på stedet eller ekstern), vil deltakerne lære hvordan de distribuerer og administrerer Apache NiFi i et levende laboratoriemiljø.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer Apachi NiFi.
- Kilde, transformer og administrer data fra forskjellige, distribuerte datakilder, inkludert databaser og store datainnsjøer.
- Automatiser dataflyter.
- Aktiver strømmeanalyse.
- Bruk ulike tilnærminger for datainntak.
- Forvandle Big Data og til forretningsinnsikt.
Apache NiFi for Developers
7 timerI denne instruktørledede, direkteopplæringen i Norge vil deltakerne lære det grunnleggende om flytbasert programmering når de utvikler en rekke demo-utvidelser, komponenter og prosessorer ved hjelp av Apache NiFi.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå NiFis arkitektur og dataflytkonsepter.
- Utvikle utvidelser ved å bruke NiFi og tredjeparts APIer.
- Tilpasset utvikle sin egen Apache Nifi-prosessor.
- Innta og behandle sanntidsdata fra forskjellige og uvanlige filformater og datakilder.
Apache Flink Fundamentals
28 timerDenne instruktørledede, direkteopplæringen i Norge (online eller på stedet) introduserer prinsippene og tilnærmingene bak distribuert strøm- og batchdatabehandling, og leder deltakerne gjennom opprettelsen av en sanntidsdatastrømningsapplikasjon i Apache Flink.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Sett opp et miljø for utvikling av dataanalyseapplikasjoner. Forstå hvordan Apache Flinks grafbehandlingsbibliotek (Gelly) fungerer. Pakk, kjør og overvåk Flink-baserte, feiltolerante datastrømmeapplikasjoner. Håndter ulike arbeidsmengder. Utfør avanserte analyser. Sett opp en multi-node Flink-klynge. Mål og optimer ytelsen. Integrer Flink med forskjellige Big Data systemer. Sammenlign Flink-funksjonene med andre rammeverk for behandling av store data.
Python and Spark for Big Data (PySpark)
21 timerI denne instruktørledede, live-treningen i Norge vil deltakerne lære å bruke Python og Spark sammen for å analysere store data mens de jobber med praktiske øvelser.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Lær hvordan du bruker Spark med Python til å analysere Big Data.
- Arbeid med øvelser som etterligner virkelige tilfeller.
- Bruk forskjellige verktøy og teknikker for stordataanalyse ved hjelp av PySpark.
Introduction to Graph Computing
28 timerI denne instruktørledede, live-opplæringen i Norge vil deltakerne lære om teknologitilbudene og implementeringstilnærmingene for behandling av grafdata. Målet er å identifisere virkelige objekter, deres egenskaper og relasjoner, deretter modellere disse relasjonene og behandle dem som data ved å bruke en Graph Computing (også kjent som Graph Analytics) tilnærming. Vi starter med en bred oversikt og begrenser oss til spesifikke verktøy når vi går gjennom en serie casestudier, praktiske øvelser og live-implementeringer.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Forstå hvordan grafdata opprettholdes og krysses.
- Velg det beste rammeverket for en gitt oppgave (fra grafdatabaser til rammeverk for batchbehandling.)
- Implementer Hadoop, Spark, GraphX og Pregel for å utføre grafberegning på tvers av mange maskiner parallelt.
- Se virkelige big data-problemer når det gjelder grafer, prosesser og traverseringer.
Apache Spark MLlib
35 timerMLlib er Sparks maskinlæringsbibliotek. Målet er å gjøre praktisk maskinlæring skalerbar og enkel. Den består av vanlige læringsalgoritmer og verktøy, inkludert klassifisering, regresjon, klynger, samarbeidende filtrering, dimensjonalitetsreduksjon, samt primitiver på lavere nivå og optimaliseringsgrensesnitt på rørledningen.
Den deler seg i to pakker:
spark.mllib inneholder den originale API-en som er bygget på toppen av RDD-er.
spark.ml gir API på høyere nivå bygget oppå DataFrames for konstruksjon av ML-rørledninger.
Publikum
Dette kurset er rettet mot ingeniører og utviklere som søker å bruke et innebygd maskinbibliotek for Apache Spark