Apache Hadoop es un framework que permite el procesamiento distribuido de grandes conjuntos de datos a través de un conjunto de ordenadores utilizando modelos básicos de programación.
Hadoop está diseñado para escalar de un servidor individual a miles de máquinas, ofreciendo computación y almacenamiento local. Por otro lado, en lugar de depender del hardware para ofrecer HA, Hadoop detecta y controla los errores en la capa de aplicación.