Lehreinheit: Suchmaschinen und Discovery-Systeme

In der 8. Sitzung haben wir mehr über Suchmaschinen erfahren dürfen.

Auch diese Sitzung ist mit den Kommentaren zu den Lerntagebüchern begonnen: Wir bekamen zunächst eine Literaturempfehlung zum Forschungsdatenmanagement, danach wurde eine Frage zur OAI-PMH-Schnittstelle (selektiv oder nicht selektiv) erläutert und abschliessend wurden uns einige Hinweise für die Vertiefung in der Transformationssprache XSLT gegeben.

Nach diesem Intro folgte ein Nachtrag aus der vorherigen Sitzung zum Thema “Metadaten modellieren und Schnittstellen nutzen”. Die Fragen “Wieso Metadatentransformation?” und “Welche andere Tools gibt es für die Transformation von Metadaten?” waren im Fokus. Die erste Frage wurde anhand von einem Praxisbeispiel beantwortet. Herr Meyer hat das Metadaten-Team des Leibnitz-Informationszentrum Wirtschaft vorgestellt, um zu zeigen, was alles das Metadatenmanagement in einer Forschungsinstitution bedeuten könnte. Für viele Begriffe, mit denen die Tätigkeiten des Teams beschrieben wurden, hatte ich nun eine Vorstellung was sie bedeuten! Obwohl ich den Inhalt der letzten Vorlesungen nicht hundertprozentig verstanden habe, konnte ich mir trotzdem ein mentales Bild vom Metadatenmanagement machen sowie verstehen, wieso beispielsweise das Erarbeiten von Mappings für die Integration heterogener Metadaten in einer Forschungsinstitution so wichtig ist.

Im zweiten Teil der Vorlesung haben wir uns mit dem neuen Thema “Suchmaschinen und Discovery-Systeme” beschäftigt. Der neue Themenblock wurde mit der Vorführung der freie Software VuFind eröffnet. VuFind ist ein bibliothekarisches Suchsystem, das weltweit in den Katalogen benutzt wird. Da es sich um ein open source Software handelt, kann man die Erweiterungen selbst einbauen (Beispiel TUHH, Uni Bibliothek Leipzig). Swisscollections ist ebenfalls mit VuFind realisiert (in diesem Katalog wurde beispielsweise die Archivtektonik nachprogrammiert).

Weiter wurde die Funktion von Suchmaschinen am Beispiel von der open source Software Solr erklärt. Solr ist der Kern im Discovery-System VuFind (ebenso wie in vielen kommerzielle Lösungen wie z.B. Ex Libris Primo), die eigentliche Suchmaschine. Sie findet enorme Verbreitung und ist zusammen mit Elasticsearch der “Industriestandard”. Sie funktionieren beide sehr ähnlich. Sie bauen einen Indexliste und ermöglichen eine Suche via eine API-Schnittstellen (API = Application programing interface). Solr strukturiert die Daten nach einem Schema (Ein Schema legt fest, welche Felder existieren und welche Datentypen diese beinhalten dürfen. Gut “bereinigte und gepflegte” Datenfelder sind entscheidend für die Effizienz einer Suchmaschine.) Das VuFind ist die Weboberfrläche um Solr, wo die Interaktion mit den Benutzer:innen stattfindet (Eingabeoberfläche, die Trefferlisten und Facetten…).

Im praktischen Teil der Vorlesung haben wie die Sichtung von Solr in VuFind auf der VM geprüft. Dazu haben wir durch Übungen die Suche in VuFind mit der Suche in Solr verglichen. Im Gegensatz zum Solr, wo die Suchergebnisse im JSON-Format generiert werden, wird VuFind wie ein normaler OPAC bedient.

Was habe ich gelernt habe:

Metadatenmanagement ist einer der Grundlagen der effizienten Forschung
VuFind ist ein weltweit verbreitetes bibliothekarisches open source Suchsystem, der sich individuell anpassen lässt (individuelle Katalogerweiterungen)
Suchmaschinen bestehen aus einem Kern (eigentliche Suchmaschinen mit einem Suchindex und dem Schema für die Datentypen = Solr) und einer GUI/Suchoberfläche, wo die Abfragen stattfinden (VuFind)
Unterschied Suchmaschine und Datenbank: Suchmaschine beinhalten einen Index, die Daten sind statisch und verändern sich nicht, Priorität = Effizienz der Suche. Datenbanken beinhalten relationale Datensätze und veränderliche Daten, Priorität = Speicherplatzgrösse (CRUD: Create, Read, Update, Delete).

Was bleibt noch unklar:

Immer noch kann ich das manuelle Anpassen von XML-Dateien nicht ganz nachvollziehen…