Telepítse az Apache Hadoop alkalmazást az Ubuntu 17-re.10!

Az Apache Hadoop nagy adatmegoldás nagy mennyiségű adat tárolására és elemzésére. Ebben a cikkben részletezzük az Apache Hadoop összetett telepítési lépéseit, hogy a lehető leggyorsabban elkezdhesse az Ubuntu használatát. Ebben a bejegyzésben telepítjük az Apache Hadoopot egy Ubuntu 17-re.10 gép.

Ubuntu verzió

Ehhez az útmutatóhoz az Ubuntu 17-es verzióját fogjuk használni.10 (GNU / Linux 4.13.0-38-általános x86_64).

Meglévő csomagok frissítése

A Hadoop telepítésének megkezdéséhez frissítenünk kell gépünket a rendelkezésre álló legújabb szoftvercsomagokkal. Megtehetjük ezt:

sudo apt-get update && sudo apt-get -y dist-upgrade

Mivel a Hadoop Java-alapú, telepítenünk kell a gépünkre. Bármely Java verziót használhatunk a Java 6 felett. Itt a Java 8-at fogjuk használni:

sudo apt-get -y telepítse az openjdk-8-jdk-headless fájlt

Hadoop fájlok letöltése

Az összes szükséges csomag már létezik gépünkön. Készen állunk a szükséges Hadoop TAR fájlok letöltésére, hogy megkezdhessük a beállításukat és futtathassunk egy minta programot a Hadoop segítségével is.

Ebben az útmutatóban telepítjük Hadoop v3.0.1. Töltse le a megfelelő fájlokat ezzel a paranccsal:

wget http: // tükör.cc.Kolumbia.edu / pub / software / apache / hadoop / common / hadoop-3.0.1 / hadoop-3.0.1.kátrány.gz

A hálózati sebességtől függően ez akár néhány percet is igénybe vehet, mivel a fájl nagy méretű:

Hadoop letöltése

Itt megtalálja a legújabb Hadoop bináris fájlokat. Most, hogy letöltöttük a TAR fájlt, kibonthatjuk az aktuális könyvtárból:

tar xvzf hadoop-3.0.1.kátrány.gz

Ennek befejezése néhány másodpercet vesz igénybe az archívum nagy fájlmérete miatt:

Hadoop nincs archiválva

Új Hadoop felhasználói csoportot adott hozzá

Mivel a Hadoop HDFS-en keresztül működik, egy új fájlrendszer megzavarhatja saját fájlrendszerünket az Ubuntu gépen is. Az ütközés elkerülése érdekében létrehozunk egy teljesen külön felhasználói csoportot, és hozzárendeljük a Hadoop-hoz, hogy az tartalmazza a saját engedélyeit. Hozzáadhatunk egy új felhasználói csoportot ezzel a paranccsal:

addgroup hadoop

Valami ilyesmit fogunk látni:

Hadoop felhasználói csoport hozzáadása

Készen állunk arra, hogy új felhasználót vegyen fel ebbe a csoportba:

useradd -G hadoop hadoopuser

Kérjük, vegye figyelembe, hogy az általunk futtatott összes parancs root felhasználóként működik. Aove paranccsal új felhasználót tudtunk hozzáadni az általunk létrehozott csoporthoz.

Ahhoz, hogy a Hadoop felhasználó műveleteket hajthasson végre, meg kell adnunk neki a root hozzáférést is. Nyissa meg a / etc / sudoers fájl ezzel a paranccsal:

sudo visudo

Mielőtt bármit hozzáadnánk, a fájl a következőképpen néz ki:

A Sudoers fájl hozzáadása előtt bármit is hozzáad

Adja hozzá a következő sort a fájl végéhez:

hadoopuser ALL = (MINDEN) ALL

Most a fájl így fog kinézni:

A Sudoers fájl a Hadoop-felhasználó hozzáadása után

Ez volt a fő beállítás a Hadoop platformjának biztosítására a műveletek végrehajtására. Most már készen állunk egyetlen csomópont Hadoop-fürt beállítására.

Hadoop egyetlen csomópont beállítása: önálló mód

Ami a Hadoop valódi erejét illeti, általában több szerveren keresztül van felállítva, hogy a nagy mennyiségű adathalmaz tetején méretezhesse Hadoop elosztott fájlrendszer (HDFS). Ez általában rendben van a hibakereső környezetekkel, és nem használják termeléshez. A folyamat egyszerűsége érdekében elmagyarázzuk, hogyan végezhetünk itt egyetlen csomópont-beállítást a Hadoop számára.

Miután befejeztük a Hadoop telepítését, futtatunk egy minta alkalmazást is a Hadoopon. Mostantól a Hadoop fájl neve hadoop-3.0.1. nevezzük át hadoop-ra az egyszerűbb használat érdekében:

mv hadoop-3.0.1 hadoop

A fájl most úgy néz ki, mint:

Mozgó Hadoop

Ideje használni a korábban létrehozott hadoop felhasználót, és a fájl tulajdonjogát az adott felhasználóhoz rendelni:

chown -R hadoopuser: hadoop / gyökér / hadoop

A Hadoop számára jobb hely lesz az / usr / local / könyvtár, ezért helyezzük át oda:

mv hadoop / usr / local /
cd / usr / local /

Hadoop hozzáadása az útvonalhoz

A Hadoop parancsfájlok végrehajtásához most hozzáadjuk az útvonalhoz. Ehhez nyissa meg a bashrc fájlt:

vi ~ /.bashrc

Adja hozzá ezeket a sorokat a .bashrc fájlt, hogy az elérési út tartalmazhassa a Hadoop futtatható fájl elérési útját:

# Konfigurálja a Hadoop és a Java Home alkalmazást
export HADOOP_HOME = / usr / local / hadoop
export JAVA_HOME = / usr / lib / jvm / java-8-openjdk-amd64
export PATH = $ PATH: $ HADOOP_HOME / bin

A fájl a következőképpen néz ki:

Hadoop hozzáadása az útvonalhoz

Mivel a Hadoop a Java-t használja, el kell mondanunk a Hadoop környezeti fájlt hadoop-env.SH ahol található. A fájl helye a Hadoop verzióitól függően változhat. A fájl helyének megkereséséhez futtassa a következő parancsot közvetlenül a Hadoop könyvtáron kívül:

talál hadoop / -név hadoop-env.SH

Megkapjuk a fájl helyének kimenetét:

Környezetfájl helye

Szerkesszük ezt a fájlt, hogy tájékoztassuk Hadoopot a Java JDK helyéről, és illesszük be a fájl utolsó sorába, és mentsük el:

export JAVA_HOME = / usr / lib / jvm / java-8-openjdk-amd64

A Hadoop telepítése és beállítása befejeződött. Most már készen állunk a minta alkalmazásunk futtatására. De várjon, soha nem készítettünk mintapéldányt!

Minta alkalmazás futtatása a Hadoop segítségével

Valójában a Hadoop telepítése egy beépített példaalkalmazással jár, amely készen áll a futtatásra, miután befejeztük a Hadoop telepítését. Jól hangzik, igaz?

Futtassa a következő parancsot a JAR-példa futtatásához:

hadoop jar / root / hadoop / share / hadoop / mapreduce / hadoop-mapreduce-példa-3.0.1.jar szószám / root / hadoop / README.txt / root / Output

Hadoop megmutatja, hogy mekkora feldolgozást végzett a csomóponton:

Hadoop statisztikák feldolgozása

Miután végrehajtotta a következő parancsot, a part-r-00000 fájlt látjuk kimenetként. Nézze meg a kimenet tartalmát:

macska rész-r-00000

Ilyeneket kap:

Szószám kimenet Hadoop által

Következtetés

Ebben a leckében megvizsgáltuk, hogyan telepíthetjük és megkezdhetjük az Apache Hadoop használatát az Ubuntu 17-en.10 gép. A Hadoop kiválóan alkalmas hatalmas mennyiségű adat tárolására és elemzésére, és remélem, hogy ez a cikk segít abban, hogy gyorsan elkezdhesse az Ubuntu használatát.