Suchen

Lucene-Suchbibliothek wird stabiler, schneller und weniger speicherhungrig Apache Lucene 5.0 veröffentlicht

| Autor / Redakteur: Dipl. -Ing. Thomas Drilling / Nico Litzel

Das Apache-Lucene-Projekt hat eine neue Hauptversion der beliebten quelloffenen, skalierbaren Such-Engine freigegeben, die sich vor allem durch eine höhere Stabilität und Indexsicherheit auszeichnen soll.

Firmen zum Thema

Freie Such-Bibliothek Apache Lucene 5.0 erhöht Indexsicherheit und Stabilität
Freie Such-Bibliothek Apache Lucene 5.0 erhöht Indexsicherheit und Stabilität
(Bild: Apache Software Foundation)

Apache Lucene, eine Programmbibliothek zur Volltextsuche, kommt zusammen mit dem auf ihr basierenden Such-Server Apache Solr als Suchmaschine bei vielen populären Web-Diensten und Open-Source-Anwendungen zum Einsatz. So ist unter anderem die Suchfunktion in der Wikipedia mit Lucene realisiert. Auch viele populäre quelloffene Groupware-Lösungen wie Scalix, Zimbra, Open-Xcjange oder Zarafa setzen auf Lucene als Such-Engine, denn Lucene lässt sich mit nahezu jeder Software gut einsetzen.

Lucene ist vollständig in Java geschrieben (Lucene Core) und bietet eine leistungsfähige Indexierungsfunktion, weitreichende Abfragemöglichkeiten und ein Sortierfunktion der Ergebnisse, wobei letztere wie der gesamte unterliegende Datenspeicher individuell konfigurierbar ist.

Neuerungen im Detail

Die neue Lucene-Version 5.0 punktet unter anderem mit einer deutlich erhöhten Indexsicherheit, weil Dateizugriffe nun die Java NIO.2-APIs verwenden, welche eine bessere Fehlerbehandlung ermöglichen. Ferner lassen sich Index-Files jetzt sicherer replizieren, weil Lucene nun je Segment und Commit eindeutige Indizes (Unique-IDs) speichert. In diesem Zusammenhang prüft ein sogenannter IndexWriter jetzt ankommende Segmente vor dem Zusammenführen permanent auf Beschädigung.

Darüber hinaus konnten die Entwickler den Speicherverbrauch für viele Operationen drastisch verringern. So unterstützt Lucene jetzt beispielsweise random-writable und advance-able sparse bitsets (RoaringDocIdSet ujnd SparseFixedBitSet), was zur Folge hat, dass der benötigte Heap nicht mehr davon abhängt, wie viele Dokumente im Index sind. Darüber hinaus optimiert sich Lucene nun automatisch für den Einsatz mit SSDs.

Viele weitere Neuerungen lassen sich der Ankündigung auf der Mailingliste entnehmen. Lucene 5.0 kann ab sofort von den Servern der Apache Software Foundation heruntergeladen werden. Wie üblich erscheint zeitgleich auch die neue Version 5.0 des zugehörigen Such-Servers Apache Solr.

(ID:43226439)

Über den Autor

Dipl. -Ing. Thomas Drilling

Dipl. -Ing. Thomas Drilling

IT-Consultant, Trainer, Freier Journalist