Last updated
Kurskode
Imp
Varighet
21 timer (vanligvis 3 dag inkludert pauser)
Krav
- knowledge of SQL
Oversikt
Cloudera Impala er en åpen kildekode massivt parallell behandling (MPP) SQL spørreskjema for Apache Hadoop kluster.
Impala gjør det mulig for brukere å utstede lav-latens SQL forespørsler til data lagret i Hadoop Distributed File System og Apache Hbase uten å kreve data bevegelse eller transformasjon.
Publikum
Dette kurset er rettet mot analytikere og data forskere som utfører analyse på data lagret i Hadoop via Business Intelligence eller SQL verktøy.
Etter dette kurset vil delegater kunne
-
Utvikle betydningsfull informasjon fra Hadoop kluster med Impala.
Skriv spesifikke programmer for å lette Business Intelligence i Impala SQL Dialect.
Forstyrrelser og problemer Impala.
Machine Translated
Kursplan
Introduction to Impala
- What is Impala?
- How Impala Differs from Relational Databases
- Limitations and Future Directions
- Using the Impala Shell
- The Impala Daemon, Statestore and Catalogue service
Loading Impala
- Explore a New Impala Instance
- Load CSV Data from Local Files
- Point an Impala Table at Existing Data Files
Analyzing Data with Impala
- Describe the Impala Table
- Basic Syntax and Querying
- Data Types
- Filtering, Sorting, and Limiting Results
- Joining and Grouping Data
- Data Loading and Querying Examples
- Improving Impala Performance
- How Impala works with Hadoop file formats
- Hands-On Exercise: Interactive Analysis with Impala
Programming Impala Applications
- Overview of the Impala SQL Dialect
- Overview of Impala Programming Interfaces
Troubleshooting Impala
- Troubleshooting Impala SQL Syntax Issues
- Troubleshooting I/O Capacity Problems
- Impala Web User Interface for Debugging