Takk for at du sendte din henvendelse! En av våre teammedlemmer vil kontakte deg straks.
Takk for at du sendte din bestilling! En av våre teammedlemmer vil kontakte deg straks.
Kursplan
Introduksjon til Mistral Multimodal Modeller
- Oversikt over Mistral Medium og multimodal evner
- OCR/dokumentmodeller og bruksområder
- Integrasjon med åpen kildekodeøkologier
OCR og Visjonsprosesser
- Grundleggende OCR med Mistral-modeller
- Forbehandling av bilder og skannede dokumenter
- Ekstrahering av strukturell tekst fra bilder
Dokumentforståelse
- Utforming av NLP-prosesser for dokumenter
- Entitettsgenkjenning, sammendrag og klassifisering
- Kryssmodal knytning av tekst- og visjonsdata
Søk- og kunnskapsapplikasjoner
- Visjon-tekstsøkssystemer
- Bygging av semantisk søk med OCR-utdata
- Bedriftsdokumentarkiver
Hjelpemiddel- og interaktive applikasjoner
- UI-design for multimodale assistenter
- Tilgjengelighetsapplikasjoner (f.eks., visjon-til-tekst)
- Verdenvende produktivitetsverktøy
Ytelse og optimalisering
- Skalering av multimodale prosesser
- Tuning av inferensytelse
- Vurdering av nøyaktighets- og effektivitetshandel
Tilfellestudier og fremtidige retninger
- Brancheapplikasjoner av multimodal AI
- Forskningstrender innen OCR og dokument-AI
- Ansvarlig AI-vekting i visjon-tekstoppdrag
Sammenfatning og neste steg
Krav
- Forståelse av begreper innen naturlig språkbehandling
- Erfaring med Python og ML-rammeverk
- Kjennskap med grunnleggende databehandling
Målgruppe
- Produktteam
- ML-forskere
- Anvendt ML-ingeniører
14 timer