Rückblick auf den Workshop "Portal vs. Schnittstelle: Sammlungsdaten vermitteln und nutzbar machen“

von Johannes Schäffer, Judith Blume, Louise Tharandt und Mathias Zinnen

Am 28. April 2026 haben wir gemeinsam mit der Sammlungskoordination der Goethe-Universität Frankfurt den Workshop „Portal vs. Schnittstelle: Sammlungsdaten vermitteln und nutzbar machen“ in Frankfurt veranstaltet. Mit 30 Teilnehmenden aus ganz Deutschland haben wir aktuelle Probleme, Fragestellungen und Lösungsvorschläge aus der realen Datenpraxis mit  Sammlungs- und Objektdaten diskutiert. Die über 20 Herausforderungen und Berichte aus der Praxis, die die Teilnehmenden mitgebracht haben, wurden zur weiteren Bearbeitung in drei Cluster unterteilt. 

Bild
Eindruck vom Workshop: 30 Personen sitzen in einem Saal der Goethe-Uni Frankfurt, an die Wand wird per Beamer eine Folie mit dem Workshoptitel projiziert.
Austausch mit 30 Teilnehmenden zur Praxis und den Herausforderungen beim Zugänglichmachen von Sammlungsdaten.

Cluster 1: Die einzelne Sammlung

Im ersten Cluster ging es um Herausforderungen und Fragen auf der Ebene einzelner Sammlungen. Die Teilnehmenden haben sich mit der Bearbeitung, Weitergabe und Präsentation von Sammlungsdaten, ausgehend von einer einzelnen Sammlung, auseinandergesetzt. Auch die Problematik von fehlendem Personal für die Bearbeitung,  Instandhaltung und Aktualisierung einer Sammlung war ein Thema. Auch die fehlenden  finanziellen Mittel für eine von Sammlungen zu nutzende Infrastruktur kamen als Diskussionspunkt auf, vor allem die Frage wer dies leisten könnte, die Universitäten, die Institute oder vielleicht die NFDI. In der Gruppe wurde der Umgang mit sensiblen Daten, etwa bei der Beforschung medizinhistorischer Sammlungen diskutiert. Zudem wurde sich mit der Abgrenzung zwischen verschiedenen Datenbanktypen befasst, am Beispiel der Unterschiede in Konzeption, Datenmodell und Nutzung zwischen Bilddatenbanken, die künstlerische Werke dokumentieren, und Objektdatenbanken, die physische Objekte erfassen und verwalten.

Cluster 2: Die universitäre Ebene

Im zweiten Cluster standen Herausforderungen auf übergeordneter Ebene, insbesondere auf der Ebene von Universitäten oder Universitätsverbünden wie dem Rhein-Main-Universitätsverbund (RMU) oder der Berlin University Alliance (BUA), auf der Tagesordnung. Hier wurden Fragen zu verschiedenen Datentypen und deren Langzeitarchivierung behandelt, da diese – wenn überhaupt – auf übergeordneter institutioneller Ebene geleistet werden kann. 
Es wurde die Frage aufgeworfen, welche zentralen Dienste, wenn sie einmal in Betrieb genommen sind, dauerhaft betrieben werden sollten (wie etwa Infrastruktur zur Erschließung) und für welche Dienste dieser Anspruch nicht zwangsweise erhoben werden kann (wie etwa öffentlichkeitswirksame Portale). Oberste Priorität, so das allgemeine Credo der Gruppe, haben guten Daten - diese überleben auch einen Wechsel der Infrastruktur.
Ein weiteres Thema war die wiederkehrende Abwägung zwischen Zentralisierung und Dezentralisierung von Daten(-Infrastrukturen). Diskutiert wurde dabei, wie zentrale Infrastrukturen die Verknüpfung von Sammlungs- und Objektdaten mit anderen Beständen, Fachdatenbanken, Aggregatoren und Bibliothekskatalogen ermöglichen können. Diskutierte Beispiele waren Fachportale und Fachdatenbanken wie JACQ und aggregierende Portale wie die Deutschen Digitalen Bibliothek

Cluster 3: KI und innovative Zugänge

Im dritten Cluster drehte sich alles um KI und neuartige Zugänge zu Sammlungsdaten. 

Zum einen wurde der Einsatz von KI in der Erschließung diskutiert, etwa in der automatisierten Erfassung von Inventarkarten oder –büchern. Angesichts der mutmaßlichen Notwendigkeit, die erfassten Daten manuell zu überprüfen und anzureichern, wurde dabei die Frage aufgeworfen, ob eine KI-generierte strukturierte Erfassung tatsächlich eine Erleichterung oder letztendlich nur eine Verschiebung des Problems darstellt. Einigkeit bestand darüber, dass eine Markierung der von KI erfassten Daten notwendig ist. Dabei sollten insbesondere auch die verwendeten Methoden klar benannt werden. Außerdem wurden Aspekte der Nachhaltigkeit und Datenautonomie diskutiert und dabei ein Spektrum zwischen lokalem Deployment der Bild-Sprachmodelle, über die Nutzung von öffentlich geförderten Institutionen wie AcademicCloud bis hin zu kommerziellen Dienstleistern eröffnet. 

Zum anderen wurden Datenpublikation und -Zugänge unter dem Gesichtspunkt der KI betrachtet. Es wurden Techniken wie RAG (Retrieval-Augmented Generation) oder MCP (Model Context Protocol) in Form von Prototypen vorgestellt, bspw. der sich in Entwicklung befindliche Smart Science Space freeda der RMU. Im Unterschied zu klassischen Zugängen über facettierte Textsuche oder SQL- / SPARQL-Anfragen ermöglichen solche Techniken eine unscharfe Suche der Sammlungsinhalte. Zur Diskussion kam, in welchen Kontexten eine solche unscharfe Suche, und in welchen eine klassische, präzise Suche ihren Wert haben. Dabei haben sich zwei mutmaßliche Nutzungsprofile herauskristallisiert: Eine explorative Suche, die sich vor allem an die breite Öffentlichkeit wendet und von den neuen Zugängen stark profitieren kann sowie eine forschende Suche, die weiterhin präzise Suchvorgänge benötigt und rekonstruierbare Suchbegriffe bzw. Anfragen voraussetzt. 

In diesem Zusammenhang wurde schließlich auch der Unterschied zwischen isolierten Sammlungsportalen und Aggregatoren sowie deren unterschiedliche Anforderungen an Datenverknüpfungen thematisiert.