Apache Solr

A legjobb önállóan üzemeltetett keresőmotorok

A legjobb önállóan üzemeltetett keresőmotorok
A főnöke tudja, hogy más munkát keres?? Mondtad már más jelentős emberének arról, hogy képtelen eldönteni, hogy gyermekeket szeretne-e vállalni? Tudnak-e szülők szexuális irányultságotokról?? Nos, a Google és más nagy keresőmotorok igen.

"A legtöbb felhasználó bejelentkezéskor keres a Google-on, így online életük minden információ elérhető: YouTube-keresések, e-mailek és korábbi keresési előzmények" - mondja Adam Tauber, a Searx adatvédelmet tiszteletben tartó metakutató motorjának vezető fejlesztője.

Természetesen használhatná a Tor névtelenségét, és minden egyes keresés után mindig törölheti tevékenységének minden nyomát, de minden keresés után nagy valószínűséggel elég gyorsan megöregszik. Ehelyett fontolóra kell vennie egy önállóan üzemeltetett keresőmotor telepítését, amely képes információk megszerzésére az Ön számára anélkül, hogy bármi érzékeny információt közölne rólad.

Két ilyen keresőmotort választottunk ki, és további három keresőmotort is bemutatunk annak bemutatására, hogy a márkanevű keresőmotorok, mint például a Google vagy a Bing kiváló alternatívái már léteznek, és könnyebben telepíthetők és használhatók, mint gondolná.

1. YaCy

A YaCy egy ingyenesen terjesztett peer-to-peer keresőmotor, amelynek alapvető összetevője Java nyelven íródott. Mivel az összes YaCy felhasználó egyenlő, és mivel a kereső nem tárolja a felhasználói keresési kérelmeket, a cenzúra egyszerűen nem lehetséges.

Jelenleg a YaCy körülbelül 1-et indexel.4 milliárd dokumentum szerepel az indexében, több mint 600 társ üzemeltető tevékenységének köszönhetően, akik havonta hozzájárulnak ehhez. Összehasonlításképpen: a Google keresési index több száz milliárd weboldalt tartalmaz, és jóval meghaladja a 100 000 000 gigabájtot.

Noha a YaCy-nak még hosszú utat kell megtennie ahhoz, hogy felvegye a versenyt a világ legnagyobb központosított keresőmotorjaival, ez már használható privát intranetek és projekt-specifikus alkalmazások keresési portáljaként, mert a YaCy egyetlen keresőegységként működhet anélkül, hogy másokkal hálózatba lépne. társaik.

A YaCy egyszerűen integrálható bármely weboldalra egyszerű kódrészleteinek köszönhetően, amelyek könnyedén másolhatók és beilleszthetők minden módosítás nélkül.

2. Searx

A Searx a magánélet tiszteletben tartása alatt feltörhető metakereső motor. A GNU Affero General Public License 3-as verziója alatt érhető el, és fő célja a felhasználók magánéletének védelme azáltal, hogy soha nem osztja meg a felhasználók IP-címeit vagy keresési előzményeit azokkal a keresőmotorokkal, amelyekről eredményeket gyűjt.

"A Searx használatakor alapértelmezés szerint a Searx IP-címét, egy véletlenszerű felhasználói ügynököt és egy keresési lekérdezést küld a Google-nak" - magyarázza Adam Tauber, más néven asciimoo, a metakereső motorjának működését. „Természetesen testre szabhatja a Searx-et úgy, hogy továbbítson további extra paramétereket, például a keresési nyelvet vagy a kért eredményoldal oldalszámát.”

A Searx automatikusan blokkolja a keresőmotorok által kiszolgált összes nyomkövetési cookie-t, hogy megakadályozza a felhasználói profilalkotáson alapuló eredmények módosítását, ami abból adódhat, hogy egy keresőmotor megpróbálja végrehajtani a keresést, amely személyre szabott, annak alapján, amit a motor tud a felhasználóról. A Searx 100 százalékban ingyenes, és bárki szükség szerint módosíthatja. Akár átveheti a Searx kódot, és futtathatja a metakereső motort a saját szerverén, amelynek mindenképpen meg kell oldania a naplókkal kapcsolatos esetleges problémákat.

3. ElasticSearch

Az ElasticSearch egy Lucene alapú keresőmotor, egy ingyenes és nyílt forráskódú információ-visszakereső szoftverkönyvtár, amelyet az Apache Software Foundation támogat, és amelyet Apache szoftverlicenc alapján adnak ki.

Az ElasticSearch teljes szövegű keresőmotort biztosít HTTP webes felülettel. A keresőmotor felhasználható mindenféle dokumentum keresésére, és könnyen elosztható több csomópont között.

Lehetőség van önállóan üzemeltetett keresőmotor létrehozására az ElasticSearch és a Docker használatával, és itt találhat egy oktatóanyagot, amely leírja a folyamatot.

4. Ambar

Az Ambar egy nyílt forráskódú dokumentum-kereső, sok hasznos funkcióval. Támogatja az automatizált feltérképezést, a címkézést és az azonnali teljes szöveges keresést, csak néhány példát felsorolva. Az Ambar egyik legizgalmasabb tulajdonsága, hogy képes OCR-t végrehajtani képeken és PDF-fájlokon. A támogatott nyelvek: angol, német, orosz, olasz, francia, spanyol, lengyel és holland.

Az Ambar egyszerűen telepíthető egyetlen docker-compose fájl segítségével, és itt megtudhatja, hogyan kell csinálni.

5. Apache Solr

A Java nyelven írt Apache Solr egy vállalati keresési platform, amely teljes szöveges keresést, találati kiemelést, sokoldalú keresést, valós idejű indexelést, dinamikus fürtözést és sok más fontos funkciót tartalmaz. 2004-ben hozták létre a CNET Networks házon belüli projektjéhez. A CNET Networks 2006-ban szívesen adományozta az Apache Software Foundation-nek, ahol 2007-ben az inkubációs státuszból önálló felső szintű projekt lett.

Ma a Solr egy rendkívül megbízható, méretezhető és hibatűrő vállalati keresőplatform, amely a világ számos legnagyobb internetes oldalának, köztük a DuckDuckGo, az eHarmony és a BestBuy keresési és navigációs funkcióit működteti. tudsz

A YaCy telepítése és beállítása

A YaCy telepítése nagyon egyszerű, és csak néhány percet vesz igénybe, mert nem kell külső adatbázist vagy webszervert telepítenie - a YaCy minden szükségeset tartalmaz.

  1. Látogasson el a YaCy hivatalos weboldalára, és töltse le a legújabb Linux-csomagot.
  2. Telepítse az OpenJDK 8 futási környezetet.
    • Ha Debian-alapú terjesztést használ, használja a következő parancsot: $ sudo apt-get install openjdk-8-jre
    • Ha nem, kövesse a terjesztésre vonatkozó utasításokat.
  3. Csomagolja ki a letöltött csomagot a kívánt helyre.
  4. Menjen az új mappába, és indítsa el a „startYACY.sh ”szkript a Terminálban.
  5. Meg kell látnia egy megerősítő üzenetet arról, hogy a YaCy démonként indult

Következtetés

A keresőmotorok többet tudnak rólunk, mint azt a legtöbben szeretnék beismerni. Ha le szeretné állítani a nagyvállalatok lédús adatokkal történő ellátását, akkor saját kezébe veheti a dolgokat, és magánéletének védelme érdekében létrehozhat egy saját üzemeltetésű keresőmotort. Bár az önállóan üzemeltetett keresőmotorok még hosszú utat kell megtenniük ahhoz, hogy teljes mértékben használhatóvá váljanak, fennáll a lehetőségük arra, hogy jobban teljesítsenek, mint a Google, és ennek megragadása csupán további felhasználók vonzásának kérdése.

Vulkan Linux felhasználók számára
A grafikus kártyák minden új generációjával azt látjuk, hogy a játékfejlesztők átlépik a grafikus hűség határait, és egy lépéssel közelebb kerülnek a ...
OpenTTD vs Simutrans
Saját közlekedési szimuláció létrehozása szórakoztató, pihentető és rendkívül csábító lehet. Ezért meg kell győződnie arról, hogy a lehető legtöbb ját...
OpenTTD bemutató
Az OpenTTD az egyik legnépszerűbb üzleti szimulációs játék. Ebben a játékban létre kell hoznia egy csodálatos szállítási vállalkozást. Azonban kezdete...