Kursplan

Introduksjon til Mistral Multimodal Modeller

  • Oversikt over Mistral Medium og multimodal evner
  • OCR/dokumentmodeller og bruksområder
  • Integrasjon med åpen kildekodeøkologier

OCR og Visjonsprosesser

  • Grundleggende OCR med Mistral-modeller
  • Forbehandling av bilder og skannede dokumenter
  • Ekstrahering av strukturell tekst fra bilder

Dokumentforståelse

  • Utforming av NLP-prosesser for dokumenter
  • Entitettsgenkjenning, sammendrag og klassifisering
  • Kryssmodal knytning av tekst- og visjonsdata

Søk- og kunnskapsapplikasjoner

  • Visjon-tekstsøkssystemer
  • Bygging av semantisk søk med OCR-utdata
  • Bedriftsdokumentarkiver

Hjelpemiddel- og interaktive applikasjoner

  • UI-design for multimodale assistenter
  • Tilgjengelighetsapplikasjoner (f.eks., visjon-til-tekst)
  • Verdenvende produktivitetsverktøy

Ytelse og optimalisering

  • Skalering av multimodale prosesser
  • Tuning av inferensytelse
  • Vurdering av nøyaktighets- og effektivitetshandel

Tilfellestudier og fremtidige retninger

  • Brancheapplikasjoner av multimodal AI
  • Forskningstrender innen OCR og dokument-AI
  • Ansvarlig AI-vekting i visjon-tekstoppdrag

Sammenfatning og neste steg

Krav

  • Forståelse av begreper innen naturlig språkbehandling
  • Erfaring med Python og ML-rammeverk
  • Kjennskap med grunnleggende databehandling

Målgruppe

  • Produktteam
  • ML-forskere
  • Anvendt ML-ingeniører
 14 timer

Antall deltakere


Pris per deltaker

Kommende kurs

Relaterte kategorier