Categoria: Hadoop

4
Giu

Buon Compleanno Hadoop!

Hadoop compie 10 anni! Apache Hadoop è un framework che supporta applicazioni distribuite con elevato accesso ai dati sotto una licenza libera; permette alle applicazioni di lavorare con migliaia di nodi e petabyte di dati. Hadoop è stato ispirato dalla MapReduce di Google e dal Google File System. Hadoop è un progetto Apache di alto […]

5
Mar

Apache HBase

Nello stack di applicazioni che costituiscono l’ecosistema di Hadoop, Apache HBase è il componente che funge da database NoSQL derivato dal progetto Google “BigTable”. I dati sono archiviati nelle righe di una tabella e i dati di ogni riga sono raggruppati in base al tipo di colonna. Bisogna fare una premessa per chi non ha ben […]

25
Feb

Hadoop YARN

Apache Hadoop YARN (Yet Another Resource Negotiator) è una tecnologia di gestione del cluster. YARN è una delle caratteristiche chiave della seconda generazione di Hadoop, il framework open source di elaborazione distribuita di Apache Software Foundation. Apache Foundation lo descrive come il nuovo (aka riprogettato) componente dedicato alla gestione delle risorse, YARN è ora caratterizzato […]

5
Feb

Hadoop Distributed File System (HDFS)

Hadoop Distributed File System (HDFS) è un file system distribuito, progettato per funzionare su hardware di largo consumo. Ha molte somiglianze con altri file system distribuiti esistenti. Tuttavia, le differenze da altri file system distribuiti sono significative: HDFS è altamente fault-tolerant ed è progettato per essere distribuito su hardware a basso costo. HDFS offre accesso […]

10
Gen

Hadoop

Con questo articolo inizio una carellata dei principali elementi che costituiscono l’ecosistema di Hadoop. Mi prendo il tempo di appuntare il risultato dell’approfondimento su questo tassello fondamentale del campo dei Big Data ed in particolare per definire come sta anche evolvendo sul piano strutturale e funzionale. Innanzitutto Hadoop è stato creato da Doug Cutting e Mike […]