Рубрики
Разработчикам

Hadoop-история или эволюция #Hadoop Had…

Hadoop-история или эволюция
#Hadoop

Hadoop — это платформа с открытым исходным кодом, контролируемая Apache Software Foundation, написанная на Java для хранения и обработки огромных наборов данных с кластером стандартного оборудования. Есть в основном две проблемы с большими данными. Первый — хранить такое огромное количество данных, а второй — обрабатывать эти сохраненные данные. Традиционного подхода, такого как RDBMS, недостаточно из-за неоднородности данных. Таким образом, Hadoop является решением проблемы больших данных, то есть хранения и обработки больших данных с некоторыми дополнительными возможностями. В основном Hadoop состоит из двух компонентов: распределенной файловой системы Hadoop (HDFS) и еще одного согласователя ресурсов (YARN) .