Рубрики
Разработчикам

Карта Уменьшить в Hadoop #Hadoop Одним…

Карта Уменьшить в Hadoop
#Hadoop

Одним из трех компонентов Hadoop является Map Reduce. Первый компонент Hadoop — распределенная файловая система Hadoop (HDFS) — отвечает за хранение файла. Второй компонент, Map Reduce, отвечает за обработку файла.

Предположим, есть файл слов, содержащий текст. Давайте sample.txt этот файл как sample.txt . Обратите внимание, что мы используем Hadoop для работы с большими файлами, но для простоты объяснения здесь мы берем текстовый файл в качестве примера. Итак, давайте предположим, что этот файл sample.txt содержит несколько строк в виде текста. Содержание файла выглядит следующим образом: