Що таке Apache Hadoop?

Apache Hadoop - це назва алгоритмів великих даних, розподіленого зберігання та програмного забезпечення для розподіленої обробки, створеного Apache Software Foundation. Він призначений для підтримки великих обсягів даних служб даних; автоматична обробка апаратних збоїв без втрати сервісу.

Hadoop використовує розподілену файлову систему, відому як HDFS, і програмне забезпечення для обробки великих наборів даних, відомих як MapReduce. Надзвичайно великі файли розділені на частини, як правило, 64 або 128 Мб кожен. Програмне забезпечення в основному написано на Java, з деяким кодом нижчого рівня, написаним на C.

Сервер Apache, великі дані, сервіс, терміни програмного забезпечення