Training: Apache Hadoop and MapReduce Essentials
Apache
6 uur
Engels (US)

Training: Apache Hadoop and MapReduce Essentials

Snel navigeren naar:

  • Informatie
  • Inhoud
  • Kenmerken
  • Meer informatie
  • Reviews
  • FAQ

Productinformatie

In deze Hadoop training / cursus leert u de basis van Hadoop en Mapreduce kennen. Zo leert u de basisconcepten van cloud computing en Big Data kennen door gebruik te maken van Apache Hadoop. Later in de cursus maakt u kennis met het MapReduce framework.

Onderwerpen die onder andere aan bod komen zijn Big Data, YARN, cluster mananagement, HDFS, Pig and Hive, Pig commands, JUnit, Cloudera MRUnit en nog veel meer.

Inhoud van de training

Apache Hadoop and MapReduce Essentials

6 uur

Apache Hadoop

  • start the course
  • describe the basics of Hadoop
  • identify the major users of Hadoop, the end-user application, and the result
  • identify the characteristics of Big Data
  • compare and contrast the traditional data sources and Big Data sources
  • describe the clustering and distributed computing concepts of Hadoop
  • specify low cost commodity servers in Big Data and its configurations as nodes in small and large scale Hadoop installations
  • describe Hadoop installation requirements
  • troubleshoot Hadoop installation issues
  • configure Hadoop installation
  • identify the features of third party Hadoop distributions
  • describe the creation and evolution of Hadoop and its related projects
  • describe the use of YARN in Hadoop cluster management
  • describe the components and functions of Hadoop
  • compare and contrast the different types of Hadoop data
  • describe the four different types of cloud databases in NoSQL Databases
  • describe the basics of the Hadoop Distributed File System
  • describe HDFS and basic HDFS navigation operations
  • perform file operations such as add and delete within HDFS
  • describe the basic principles of MapReduce and general mapping issues
  • specify the use of Pig and Hive in Hadoop Map Reduce jobs
  • describe the use of MapReduce, MapReduce lifecycle, job client, job tracker, task tracker, map tasks, and reduce tasks
  • describe Hadoop MapReduce handles, data processes data, and vocabulary of the MapReduce dataflow process
  • describe the process of mapping and reducing
  • describe the basic principles and uses of Hadoop

MapReduce Essentials

  • start the course
  • describe the job components and the steps of Hadoop MapReduce
  • identify how each MapReduce process is vital to the overall MapReduce algorithm through a conceptual example
  • configure Java to write Hadoop MapReduce jobs and identify the functionality of the classes within additional JARs
  • create and execute Hadoop MapReduce jobs, and perform compilation and running of MapReduce programs
  • describe the basic features and functions of the programmatic steps in a Hadoop MapReduce job
  • describe the concept of MapReduce chaining and compare the input and output steps in MapReduce jobs
  • identify the precompile, compile, and run commands, and specify different techniques to package and run MapReduce jobs
  • describe the storage and reading of MapReduce stores and Big Data, and handling of MapReduce and Hadoop data with HDFS over a distributed processing system
  • compare the persistence in the HDFS with other file storage systems, describe the specifics of reading and writing data in the HDFS, and the redundancy of HDFS across the cluster
  • describe the basics of Apache Hive and HiveQL
  • classify the usage of the four file formats supported in Hive – TEXTFILE, SEQUENCEFILE, ORC, and RCFILE
  • describe how to write Hive jobs by using the custom Hive data types – arrays and maps
  • describe how Pig is used to obtain data by using it as Pig Latin, like SQL
  • write Pig scripts, and describe the Pig, Local, MapReduce, and Batch modes
  • list the Pig commands such as LOAD, LIMIT, DUMP, and STORE for data read/write operators in Pig Latin
  • compare and contrast the internals and performance, and analyze the strengths and weaknesses of MapReduce, Hive, and Pig
  • describe the jobs run in MapReduce, and the unit testing process, tools, and techniques
  • recognize MapReduce job status, review, and understand the log files of different distributions of Hadoop
  • identify the scenarios where a MapReduce job would need to be terminated, and apply the "-list" and "-kill" commands
  • define JUnit and JUnit configuration scripts, and identify testing techniques and test cases using JUnit
  • describe Cloudera MRUnit, unit testing process, and unit testing files, and compare unit testing with MRUnit and without MRUnit
  • apply the use of a dummy cluster for unit and integration testing, and the basics of a mini HDFS and a mini MapReduce cluster
  • define the basics of the Hadoop LocalJobRunner
  • describe the basics of programming in MapReduce, Hive, and Pig

Kenmerken

Engels (US)
6 uur
Apache
90 dagen online toegang
HBO

Meer informatie

Doelgroep Softwareontwikkelaar, Webontwikkelaar, Databasebeheerders
Voorkennis

Voor deze cursus is geen specifieke voorkennis vereist.

Resultaat

Na het volgen van deze training bent u bekend met de basisprincipes van Apache Hadoop en het MapReduce framework.

Positieve reacties van cursisten

Training: Leidinggeven aan de AI transformatie

Nuttige training. Het bestelproces verliep vlot, ik kon direct beginnen.

- Mike van Manen

Onbeperkt Leren Abonnement

Onbeperkt Leren aangeschaft omdat je veel waar voor je geld krijgt. Ik gebruik het nog maar kort, maar eerste indruk is goed.

- Floor van Dijk

Training: Leidinggeven aan de AI transformatie

Al jaren is icttrainingen.nl onze trouwe partner op het gebied van kennisontwikkeling voor onze IT-ers. Wij zijn blij dat wij door het platform van icttrainingen.nl maatwerk en een groot aanbod aan opleidingen kunnen bieden aan ons personeel.

- Loranne, Teamlead bij Inwork

Hoe gaat het te werk?

1

Training bestellen

Nadat je de training hebt besteld krijg je bevestiging per e-mail.

2

Toegang leerplatform

In de e-mail staat een link waarmee je toegang krijgt tot ons leerplatform.

3

Direct beginnen

Je kunt direct van start. Studeer vanaf nu waar en wanneer jij wilt.

4

Training afronden

Rond de training succesvol af en ontvang van ons een certificaat!

Veelgestelde vragen

Veelgestelde vragen

Op welke manieren kan ik betalen?

Je kunt bij ons betalen met iDEAL, PayPal, Creditcard, Bancontact en op factuur. Betaal je op factuur, dan kun je met de training starten zodra de betaling binnen is.

Hoe lang heb ik toegang tot de training?

Dit verschilt per training, maar meestal 180 dagen. Je kunt dit vinden onder het kopje ‘Kenmerken’.

Waar kan ik terecht als ik vragen heb?

Je kunt onze Learning & Development collega’s tijdens kantoortijden altijd bereiken via support@icttrainingen.nl of telefonisch via 026-8402941.

Background Frame
Background Frame

Onbeperkt leren

Met ons Unlimited concept kun je onbeperkt gebruikmaken van de trainingen op de website voor een vast bedrag per maand.

Bekijk de voordelen

Heb je nog twijfels?

Of gewoon een vraag over de training? Blijf er vooral niet mee zitten. We helpen je graag verder. Daar zijn we voor!

Contactopties