Рубрики
Разработчикам

Apache Hive #Hadoop Apache Hive— это хр…

Apache Hive
#Hadoop

Apache Hive— это хранилище данных и инструмент ETL, который обеспечивает SQL-подобный интерфейс между пользователем и распределенной файловой системой Hadoop (HDFS), которая интегрирует Hadoop. Он построен поверх Hadoop. Это программный проект, который обеспечивает запрос и анализ данных. Он облегчает чтение, запись и обработку широких наборов данных, которые хранятся в распределенном хранилище и запрашиваются с помощью синтаксиса Structure Query Language (SQL). Он не предназначен для рабочих нагрузок OLTP. Он часто используется для задач хранилищ данных, таких как инкапсуляция данных, специальные запросы и анализ огромных наборов данных. Он разработан для повышения масштабируемости, расширяемости, производительности, отказоустойчивости и слабой связи с входными форматами.