Tartalomjegyzék:
Meghatározás - Mit jelent az Apache Lucene?
Az Apache Lucene nyílt forráskódú projekt nagy teljesítményű és teljes funkcionalitású szöveges keresőmotor-könyvtárhoz, amelyet teljes egészében a Java használatával írunk.
Képes a teljes szövegben történő keresésre a dokumentumokban, tehát ez egy olyan technológia, amely alkalmas minden olyan alkalmazáshoz, amely megköveteli ezt a funkciót, különösen ha platformokon átnyúló.
Elsőként Doug Cutting fejlesztette ki 1999-ben, és 2001 szeptemberében hivatalosan az Apache Alapítvány Jakarta családjának nyílt forráskódú Java projektek részévé vált. 2005. februárjában korszerűsítették az Apache legmagasabb szintű projektjévé.
A Techopedia magyarázza az Apache Lucene-t
Az Apache Lucene nagy teljesítményű keresőmotor, amelynek logikai architektúrája a "szövegmezőt tartalmazó dokumentum" fogalmával rendelkezik. Ez nagy rugalmasságot és lehetővé teszi a Lucene API függetlenségét bármilyen fájlformátumtól.
Az olyan formátumú szövegek, mint az MS Word, HTML, XML, PDF és OpenDocument, indexálhatók mindaddig, amíg a szöveges információ kibontható, ami azt jelenti, hogy a képekkel semmit sem tud tenni.
A Lucene alkalmazható minden olyan alkalmazáshoz, amelyhez teljes szöveg-indexelésre és keresési képességre van szükség, de széles körben elismerten nagyszerű segédprogramként internetes keresőmotorok megvalósításához és helyi, egyetlen oldalon történő kereséshez.
Jellemzők:
- Méretezhető és nagy teljesítményű indexelés - 150 Gb / óra sebességgel képes feldolgozni a modern hardvert, és csak 1 MB szükséges halom memóriaigényhez.
- Erőteljes, pontos és hatékony keresési algoritmusok - sokféle hatékony lekérdezést kínál, például kifejezéseket, helyettesítő karaktereket, közelségi és tartomány lekérdezéseket. Ezenkívül a keresés és a szétválogatás bármilyen területre kiterjed.
- Több platformon keresztül - tiszta Java megvalósítás, és más programozási nyelveken is elérhető.