Hjem
Big Data Treningskurs
Apache Spark Treningskurs
SMACK-stakken for data science Treningskurs

SMACK-stakken for data science Treningskurs

SMACK er en samling av dataplattformssprogramvare, nemlig Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra og Apache Kafka. Ved å bruke SMACK-stakken kan brukere opprette og skaler datahåndteringstjenester.

Dette instruktørførte, live-kurs (online eller på stedet) er rettet mot datavitenskapsfolk som ønsker å bruke SMACK-stakken til å bygge datahåndteringstjenester for store dataløsninger.

Til slutt av dette kurs, vil deltakerne kunne:

Implementere en datapipelinearkitektur for behandling av store data.
Utvikle en klusterinfrastruktur med Apache Mesos og Docker.
Analysere data med Spark og Scala.
Hantere ustrukturerte data med Apache Cassandra.

Kursformat

Interaktiv foredrag og diskusjon.
Mange øvelser og praksisoppgaver.
Hånd-onn implementering i et live-lab-miljø.

Kursanpassingsmuligheter

For å anbefale et tilpasset kurs for dette emnet, vennligst kontakt oss for å arrangere.

Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.

Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.

Kursplan

Introduksjon

Oversikt over SMACK-stakken

Hva er Apache Spark? Apache Spark-funksjoner
Hva er Apache Mesos? Apache Mesos-funksjoner
Hva er Apache Akka? Apache Akka-funksjoner
Hva er Apache Cassandra? Apache Cassandra-funksjoner
Hva er Apache Kafka? Apache Kafka-funksjoner

Scala-programmeringsspråk

Scala-syntaks og struktur
Scala-kontrollflyt

Forberedelse av utviklingsmiljøet

Installasjon og konfigurasjon av SMACK-stakken
Installasjon og konfigurasjon av Docker

Apache Akka

Bruke aktører

Apache Cassandra

Opprette en database for leseoperasjoner
Arbeide med sikkerhetskopi og gjenoppretting

Kobleprogrammer

Opprette en strøm
Bygge et Akka-program
Lagre data med Cassandra
Gjennomgang av kobleprogrammer

Apache Kafka

Arbeide med kluster
Opprette, publisere og konsumere meldinger

Apache Mesos

Allokere ressurser
Kjøre kluster
Arbeide med Apache Aurora og Docker
Kjøre tjenester og jobber
Distrere Spark, Cassandra og Kafka på Mesos

Apache Spark

Hantere datastrømmer
Arbeide med RDDs og dataframes
Utføre dataanalyse

Feilsøking

Håndtere feil i tjenester og feil

Sammenfattning og konklusjon

Krav

Forståelse av dataprogramvaresystemer

Målgruppe

Datavitenskapsfolk

14 Timer

Antall deltakere

(Online)

Klasserom

Velg sted

Vennligst velg et sted

Pris per deltaker

Åpne kurs krever 5+ deltakere.

SMACK-stakken for data science Treningskurs - Bestilling

Fullt navn *

E-post *

Telefon *

Stillingstittel

Bedriftsnavn

Adresse 1 *

By *

Fylke / Provinse

Land *

Postnummer *

Startdato

Merverdiavgiftsnr

Datoer er underlagt tilgjengelighet og finner sted mellom 09:30 og 16:30.

Betaling *

Bankoverføring (Faktura, PO)

Debit / Kreditkort

Kommentarer

Vilkår og Betingelser *

Jeg er en autorisert representant for kunden ovenfor og ønsker å bestille de ovennevnte kursene eller tjenestene i henhold til NobleProgs vilkår og betingelser og personvernerklæring.

Informér meg om rabatter og markedsføring

Vennligst les vår Personvernerklæring for å se hvordan vi bruker dine data.

SMACK-stakken for data science Treningskurs - Forespørsel

Fullt navn *

E-post *

Telefon *

Antall deltakere

Bedriftsnavn

Bedriftsadresse

Hvordan vil du ta kurset?

Kundebygninger

Nettbasert

Klasserom

Kommentarer

Informér meg om rabatter og markedsføring

Vennligst les vår Personvernerklæring for å se hvordan vi bruker dine data.

SMACK-stakken for data science - Konsulentforespørsel

Fullt navn *

Telefon *

E-post *

Bedriftsnavn

Konsulentemne *

Konsulentmål

Hvem vil konsulenten jobbe med?

Konsulentnødvendighet *

Kommentarer

Informér meg om rabatter og markedsføring

Vennligst les vår Personvernerklæring for å se hvordan vi bruker dine data.

Referanser (1)

meget interaktiv...

Richard Langford

Kurs - SMACK Stack for Data Science

3000 EUR (Nettbasert)

3400 EUR (Klasserom)

Relaterte kurs

Innføring i Data Science og KI med Python

35 Timer

Dette er en innføring i Data Science og Kunstig Intelligens (KI) over fem dager.

Kurset leveres med eksempler og øvelser som bruker Python

Les mer...

Automating Machine Learning Pipelines

21 Timer

Denne instruktørledede, live opplæringen (online eller på sted) er rettet mot deltakere på mellomnivå som ønsker å automatisere og administrere maskinlæringsarbeidsflyter, inkludert modelltrening, validering og deployering ved bruk av Apache Airflow.

Ved slutten av denne opplæringen vil deltakerne være i stand til å:

Opprette Apache Airflow for maskinlæringsarbeidsflytovervåkning.
Automatisere datapreprosessering, modelltrening og valideringsoppgaver.
Integrere Airflow med maskinlæringsrammeverk og verktøy.
Deployere maskinlæringsmodeller ved bruk av automatiserte rørledninger.
Overvåke og optimalisere maskinlæringsarbeidsflyter i produksjon.

Les mer...

Anaconda Økosystem for dataforsker

14 Timer

Denne instruktørledede, direkteopplæringen i Norge (online eller på stedet) er rettet mot dataforskere som ønsker å bruke Anaconda-økosystemet til å fange opp, administrere og distribuere pakker og dataanalysearbeidsflyter på én enkelt plattform.

Ved slutten av denne opplæringen vil deltakerne kunne:

Installer og konfigurer Anaconda komponenter og biblioteker.
Forstå kjernekonseptene, funksjonene og fordelene ved Anaconda.
Administrer pakker, miljøer og kanaler ved hjelp av Anaconda Navigator.
Bruk Conda-, R- og Python-pakker for datavitenskap og maskinlæring.
Bli kjent med noen praktiske brukstilfeller og teknikker for å administrere flere datamiljøer.

Les mer...

AWS Cloud9 for Data Science

28 Timer

Denne opplæringskurset ledet av en instruktør (online eller på stedet) er rettet mot mellomnivå dataforskere og analytikere som ønsker å bruke AWS Cloud9 for strømlinjeformede dataforskningsarbeidsflyter.

Ved avslutningen av denne opplæringen vil deltakerne kunne:

Opprette en dataforskingsmiljø i AWS Cloud9.
Utføre dataanalyse ved hjelp av Python, R og Jupyter Notebook i Cloud9.
Integrere AWS Cloud9 med AWS tjenester for data som S3, RDS og Redshift.
Bruke AWS Cloud9 til utvikling og implementering av maskinlæringsmodeller.
Optimalisere cloudbaserte arbeidsflyter for dataanalyse og -behandling.

Les mer...

Introduksjon til Google Colab for data science

14 Timer

Dette instruktørledede, live-treningen i Norge (online eller på stedet) er rettet mot datavitenskapsforskere og IT-professionelle med begynnernivå som ønsker å lære grunnleggende dataviten ved hjelp av Google Colab.

Ved slutten av denne treningen vil deltakerne kunne:

Sette opp og navigere i Google Colab.
Skrive og kjøre grunnleggende Python-kode.
Importere og håndtere datasett.
Opprette visualiseringer ved hjelp av Python-biblioteker.

Les mer...

Data Science essential for Marketing/Sales professionals

21 Timer

Denne kurset er ment for markedsførings- og salgsprofesjoneller som ønsker å dykkere dypere inn i anvendelsen av datascience i markedsføring/salg. Kurset gir detaljert dekning av ulike datascience-teknikker som brukes for "upsale", "cross-sale", markedssegmentering, merkevarebygging og CLV.

Forskjellen mellom markedsføring og salg - Hvordan er salg og markedsføring forskjellige?

I veldig enkle ord kan salg beskrives som en prosess som fokuserer eller retter seg mot individer eller små grupper. Markedsføring på sin side retter seg mot en større gruppe eller den generelle offentligheten. Markedsføring inkluderer forskning (identifisering av kundens behov), utvikling av produkter (produksjon av innovative produkter) og fremme av produktet (gjennom reklame) og skaper bevissthet om produktet blant forbrukerne. På denne måten betyr markedsføring å generere leads eller potensielle kunder. Når produktet er på markedet, er det oppgave til salgsansvarlig å overbevise kunden om å kjøpe produktet. Salg betyr å konvertere leads eller potensielle kunder til kjøp og ordrer, mens markedsføring er rettet mot lengre mål, handler salg om kortere mål.

Les mer...

Inntroksjon til Data Science

35 Timer

Denne instruktørbaserte, live-kurs (online eller på stedet) er rettet mot profesjonelle som ønsker å starte en karriere i Data Science.

Ved slutten av dette kurset vil deltakerne være i stand til:

Installasjon og konfigurering av Python og MySql.
Få en forståelse for hva Data Science er og hvordan det kan legge til verdien i nesten enhver virksomhet.
Lære grunnleggende koding i Python.
Lære om overvåket og uovervåket maskinlæringsteknikker, og hvordan implementere dem og tolke resultatene.

Kursformat

Interaktiv foredrag og diskusjon.
Massivt med øvelser og trening.
Praktisk implementering i et live-lab-miljø.

Kurs tilpasningsmuligheter

For å be om en tilpasset trening for dette kurset, vennligst kontakt oss for å avtale.

Les mer...

Jupyter for Data Science Teams

7 Timer

Denne instruktørledede, live-trening på Norge (online eller på sted) introduserer ideen om samarbeidsutvikling innen datascience og demonstrerer hvordan man bruker Jupyter til å følge og delta som et team i "livssyklusen til en beregningside". Den leder deltakere gjennom opprettelsen av et eksempel på et datascience-prosjekt basert på Jupyter-økosystemet.

Ved slutten av denne treningen vil deltakerne kunne:

Installere og konfigurere Jupyter, inkludert opprettelse og integrering av et team-repositorium på Git.
Bruk Jupyter-funksjoner som utvidelser, interaktive widget og flerbruker-modus for å muliggjøre samarbeid på prosjekter.
Opprette, dele og organisere Jupyter Notebooks med teammedlemmer.
Velge mellom Scala, Python, R, for å skrive og kjøre kode mot store datasystemer som Apache Spark, alt gjennom Jupyter-grensesnittet.

Les mer...

Kaggle

14 Timer

Denne instruktørledede, liveopplæringen i Norge (online eller på stedet) er rettet mot datavitere og utviklere som ønsker å lære og bygge karrierer i Data Science ved hjelp av Kaggle.

Ved slutten av denne opplæringen vil deltakerne kunne:

Lær om datavitenskap og maskinlæring.
Utforsk dataanalyse.
Lær om Kaggle og hvordan det fungerer.

Les mer...

Data Science med KNIME Analytics Platform

21 Timer

KNIME Analytics Platform er et førende open source alternativ for data-drevet innovasjon, som hjelper deg til å oppdage det skjulte potensialet i dataene dine, mine for nye innsikter eller predikere nye fremtider. Med mer enn 1000 moduler, hundrevis av klargjorte eksempler, et omfattende utvalg av integrerte verktøy og det bredeste utvalget av avanserte algoritmer tilgjengelig, er KNIME Analytics Platform den perfekte verkstedboksen for enhver datakonsulent og business-analyst.

Dette kurset i KNIME Analytics Platform er en ideell mulighet for begyndere, avanserte brukere og KNIME-eksperter å bli introdusert for KNIME, lære hvordan man bruker det effektivt, og hvordan man skaper klare, omfattende rapporter basert på KNIME-arbeidsflyter.

Dette instruktørførede, live-kurset (online eller plassert) er rettet mot data-professionelle som ønsker å bruke KNIME for å løse komplekse business-behov.

Det er ment for en målgruppe som ikke kjenner til programmering, men som har hensikt med å bruke avanserte verktøy for å implementere analytics-scenarier.

Ved kursets slutt vil deltakerne kunne:

Instalere og konfigurere KNIME.
Bygge Data Science-scenarier
Trene, teste og validere modeller
Implementere en end-to-end verdi kjede for data science-modeller

Kursformat

Interaktiv foredrag og diskusjon.
Masse øvelser og praksis.
Hånd-on implementering i en live-lab miljø.

Kursanpassningsalternativer

For å be om et tilpasset kurs for dette programmet eller for å få mer informasjon, vennligst kontakt oss for å arrangere.

Les mer...

Accelerating Python Pandas Workflows with Modin

14 Timer

Denne instruktørledede, live-opplæringen i Norge (online eller på stedet) er rettet mot dataforskere og utviklere som ønsker å bruke Modin til å bygge og implementere parallelle beregninger med Pandas for raskere dataanalyse.

Ved slutten av denne opplæringen vil deltakerne kunne:

Sett opp det nødvendige miljøet for å begynne å utvikle Pandas arbeidsflyter i skala med Modin.
Forstå funksjonene, arkitekturen og fordelene ved Modin.
Kjenn forskjellene mellom Modin, Dask og Ray.
Utfør Pandas operasjoner raskere med Modin.
Implementer hele Pandas API og funksjoner.

Les mer...

PySpark og Maskinlæring

21 Timer

Denne opplæringen gir en praktisk innføring i å bygge skalerbare databehandlings- og maskinlæringsarbeidsflyter ved hjelp av PySpark. Deltakerne lærer hvordan Apache Spark fungerer i moderne Big Data-ekosystemer, og hvordan man effektivt behandler store datasett ved hjelp av prinsippene for distribuert datateknikk.

Les mer...

GPU Data Science med NVIDIA RAPIDS

14 Timer

Denne instruktørledede, live treningen (online eller på stedet) er rettet mot datavitere og utviklere som ønsker å bruke RAPIDS for å bygge GPU-akselerte datapipeliner, arbeidsflyter og visualiseringer, ved å bruke maskinlæringsalgoritmer, slik som XGBoost, cuML, etc.

Ved slutten av denne treningen vil deltakerne være i stand til å:

Opprette den nødvendige utviklingsmiljøet for å bygge datamodeller med NVIDIA RAPIDS.
Forstå funksjonene, komponentene og fordelene ved RAPIDS.
Utnytt GPU til å akselerere ende-til-ende data- og analytiske pipeliner.
Implementere GPU-akselert datapreparering og ETL med cuDF og Apache Arrow.
Lære å utføre maskinlæringsoppgaver med XGBoost- og cuML-algoritmer.
Bygge data-visualiseringer og utføre grafanalyse med cuXfilter og cuGraph.

Les mer...

Python og Spark for Big Data (PySpark)

21 Timer

I denne instruktørledede, live-treningen i Norge vil deltakerne lære å bruke Python og Spark sammen for å analysere store data mens de jobber med praktiske øvelser.

Ved slutten av denne opplæringen vil deltakerne kunne:

Lær hvordan du bruker Spark med Python for å analysere Big Data.
Arbeid med øvelser som etterligner virkelige tilfeller.
Bruk forskjellige verktøy og teknikker for stordataanalyse ved hjelp av PySpark.

Les mer...

Stratio: Rocket og Intelligence-moduler med PySpark

14 Timer

Stratio er en data-sentrert plattform som integrerer store data, kunstig intelligens og styring i én løsning. Dets Rocket- og Intelligence-moduler gjør det mulig å utforske, transformere og analysere data raskt i virksomhetsmiljøer.

Denne veiledede, live-treningen (online eller på stedet) er rettet mot mellomnivås dataprofessionelle som ønsker å bruke Rocket- og Intelligence-modulene i Stratio effektivt med PySpark, med fokus på løkkestrukturer, brukerdefinerte funksjoner og avansert data-logikk.

Ved slutten av denne treningen vil deltakerne kunne:

Navigere og jobbe i Stratio-plattformen ved hjelp av Rocket- og Intelligence-modulene.
Bruke PySpark i sammenheng med datainnlesing, -transformasjon og -analyse.
Bruke løkker og betinget logikk for å kontrollere data-arbeidsflyt og uttrekk av egenskaper.
Opprette og administrere brukerdefinerte funksjoner (UDFs) for gjenbrukbare dataoperasjoner i PySpark.

Kursformat

Interaktiv foredrag og diskusjon.
Masse øvelser og praksis.
Praktisk implementering i et live-lab-miljø.

Kurstilpasningsoptions

For å forespørre en tilpasset trening for dette kurset, vennligst kontakt oss for å ordne det.

Les mer...

Relaterte kategorier

SMACK-stakken for data science Treningskurs

Kursplan

Krav

Referanser (1)

Richard Langford

Kurs - SMACK Stack for Data Science

Kommende kurs

SMACK-stakken for data science

SMACK-stakken for data science

SMACK-stakken for data science

SMACK-stakken for data science

SMACK-stakken for data science

SMACK-stakken for data science

Relaterte kategorier

Denne siden i andre land/regioner

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites