Kursplan

Introduksjon

Prinsipper for distribuert databehandling

    Apache Spark Hadoop

Prinsipper for Data Serialization

    Hvordan dataobjekt sendes over nettverket Serialisering av objekter Serialisering nærmer seg Thrift Protocol Buffere Apache Avro datastruktur størrelse, hastighet, formategenskaper vedvarende datalagring integrasjon med dynamiske språk dynamiske skriveskjemaer umerkede dataendringsadministrasjon

Data Serialization og distribuert databehandling

    Avro som et delprosjekt av Hadoop Java serialisering Hadoop serialisering Avro serialisering

Bruker Avro med

    Hive (AvroSerDe) Pig (AvroStorage)

Portering av eksisterende RPC-rammer

Oppsummering og konklusjon

Krav

  • En generell kjennskap til distribuert databehandling.
 14 timer

Antall deltakere



Price per participant

Testimonials (3)

Relaterte kurs

Related Categories