Lehreinheit: Nachtrag zu Suchmaschinen und Discovery-Systeme und Kursabschluss

In der letzten Lehreinheit haben wir das Thema Suchmaschinen und Discovery-Systeme beendet und die Transformation zu der Linked Data angesprochen. Hier die wichtigsten Erkenntnisse.

Zu Beginn der letzten Vorlesung des Moduls gab es noch einen kurzen Nachtrag zum Thema horizontale und vertikale Suchmaschinen gefolgt vom Marktübersicht der Discovery-Systeme und Praxisberichten. Der Kurs wurde mit dem Input zum Thema Linked Data abgeschlossen.

Was sind die Unterschiede zwischen einer horizontalen und einer vertikalen Suchmaschine? Eine horizontale Suchmaschine, beispielsweise Google, macht auf einer Webseite keine semantische Suche (nur Volltext). Das heisst, dass sie, unterschiedlich zu Solr, wo Felder und Datentype vordefiniert sind, kein Schema braucht. Mit einer horizontalen Suchmaschine lassen sich keine semantischen Absprachen machen. Vertikale Suchmaschine ermöglicht das Filtern bei der Suche. Diese Funktion ist möglich, weil ein Index enthalten ist (ein Hinweis für eine vertikale Maschine sind Filtermöglichkeiten). Apache Solr kann für beide Szenarien eingesetzt werden, hat aber besondere Stärken in vertikalen Anwendungsfällen.

Nach diesem Exkurs sind wir zum Marktüberblick von Discovery-Systeme gekommen. Wir haben uns nochmals den Marshall Breeding Report angeschaut, der allgemein sehr nützlich ist um sich über die verschiedenen Systeme zu informieren (wir haben diese Quelle bereits bei den Bibliothekssystemen konsultiert). Die Funktionalität eines Discovery-Systems besteht aus mindestens zwei Komponenten: Die Software und die Daten. Der Marktführer bei den Discovery Systemen ist Ex Libris mit Primo. Kommerzielle Discovery-Systeme verkaufen einen Suchindex meist separat, der vor allem Metadaten zu elektronischen Artikeln enthält. Bei der open source Software hat es wenig alternativen. Man muss sich um einen zentralen Index kümmern (jedoch gibt es Lösungen, wie z. B. K10 Plus, dessen Index man für schmales Geld benutzen kann und VuFind mit so einem Index versorgen). In der Schweiz wird wegen SLSP mehrheitlich Ex Libris Alma und damit auch das dazu gehörige Discovery-System Primo VE benutzt. Dazu gibt es das Portal swisscollections, das als Eigenentwicklungen der UB Basel mit VuFind realisiert wurde.

Im zweiten Teil der Vorlesung haben die Dozenten aus der Praxis berichtet. Sie haben uns zwei Projekte vorgestellt, an denen sie gearbeitet haben. Das Literaturarchiv in Marbach ist gleichzeitig Museum, Bibliothek und Archiv. Problem besteht darin, dass alle Objekte nach einem anderen Regelwerk erschlossen wurden und in einem separaten Katalog gesucht werden mussten. Dies ist den Benutzer:innen nicht immer bewusst (ein ähnliches Beispiel aus der Schweiz ist das Sozialarchiv in Zürich mit dem Bibliothkes-, Archiv- und Dokumentationsbestand). Die Dozenten haben ein Prototyp erstellt und sich überlegt, wie man die Daten homogenisieren könnte. Sie haben einen “Proof of Concept”-Dokument erstellt, das als Beweis diente, dass eine übergreifbare Suche in allen drei Katalogen technisch möglich ist. Diese Erfolgte über den bereits existierenden Normdateien und dem neu definierten Indexschema (neue Facetten). Das zweite Projekt, das sie uns vorgestellt haben, war die Datenintegration für das Portal noah.nrw (Open-Access-Ressourcen in Nordrhein-Westfalen).

Das abschliessende Thema war Linked Data bzw. die aktuellen Datenmodelle für Bibliotheken und Archiven, die Linked Data Transformation unterstützen können. Diese sind BIBFRAME für Bibliotheken (Nachfolger von MARC21, wird von LOC gepflegt, basiert auf FRBR sowie RDA, Datenmodell unterscheidet zwischen Work, Instance und Item) und RiC-Records in Contexts für Arhive (soll neue und mehrfache Beziehungen zwischen Entitäten ermöglichen). Ansatz der Link Data ist, nicht alle Informationen in einen Datensatz zu packen, sondern die “Schnipsel” verknüpfen und somit aussagen über ein Werk zu machen.

Was habe ich gelernt:

Unterschiede zwischen einer horizontalen und einer vertikalen Suchmaschine
Der Marktführer bei den Discovery Systemen ist Ex Libris mit Primo
Aktuellen Datenmodelle nach dem Ansatz der Link Data: BIBFRAME und RiC