Kursplan

Oversikt over CANN Optimeringsevner

  • Hvordan inferensytelse blir håndtert i CANN
  • Optimeringsevner for AI-systemer på kant og innbygd
  • Forståelse av AI Core-bruk og minneallokering

Bruk av Graph Engine for Analyse

  • Introduksjon til Graph Engine og kjøretidsrør
  • Visualisering av operatørgrafer og kjøretidsmetrikker
  • Endring av beregningsgrafer for optimering

Profileringverktøy og Ytelsesmetrikker

  • Bruk av CANN Profileringverktøy (profiler) for arbeidsbelastningsanalyse
  • Analyse av kjernekjøretid og flaskehalser
  • Minneadgangsprofilering og tilingsstrategier

Utvikling av Tilpassede Operatører med TIK

  • Oversikt over TIK og operatørprogrammeringsmodell
  • Implementering av en tilpasset operatør ved hjelp av TIK DSL
  • Testing og benchmarking av operatørytelse

Avansert Operatøroptimering med TVM

  • Intro til TVM-integrasjon med CANN
  • Auto-tuning-strategier for beregningsgrafer
  • Når og hvordan man skal skifte mellom TVM og TIK

Minneoptimeringsteknikker

  • Håndtering av minnelayout og bufferplasserings
  • Teknikker for å redusere bruk av on-chip-minne
  • Beste praksiser for asynkron kjøring og gjenbruk

Praktiske Implementeringer og Case Studies

  • Case study: Ytelsestuning for smart by-kamera-pipeline
  • Case study: Optimalisering av selvkørende kjøretøys inferensstack
  • Retningslinjer for iterativ profilering og kontinuerlig forbedring

Sammenfatning og Neste Skritt

Krav

  • Stor forståelse av dybdelæringsmodellarkitekturer og treningsarbeidsflyter
  • Erfaring med modellimplementering ved bruk av CANN, TensorFlow, eller PyTorch
  • Kjennskap til Linux CLI, skallskripting, og Python programmering

Målgruppe

  • AI-ytelsesingeniører
  • Spesialister i inferensoptimalisering
  • Utviklere som jobber med edge AI eller sanstidsystemer
 14 timer

Antall deltakere


Price per participant

Upcoming Courses

Related Categories