Chaotische Datenbanken in den Griff bekommen

Dieser Artikel wurde ursprünglich für den Sommer-Newsletter 2025 des Registrars Committee Western Region geschrieben: https://rcwr.org/newsletters/ 

Normalerweise schreibe ich über den Umgang mit dem Chaos, das sich bisweilen in unseren Sammlungen findet. Überfüllte Depots. Verrottende Kleidung. Überraschende Funde in den Büros unserer Vorgänger*innen. Aber heute möchte ich über eine andere Form von Chaos schreiben: Die Informationen, die in Ihrer Datenbank gespeichert wurden – oder eben auch nicht.

Sie haben gar keine Datenbank? Dann hilft Ihnen dieser Artikel vielleicht dabei, sich auf den Moment vorzubereiten, an dem Sie eine bekommen werden. Vielleicht hilft er auch dabei zu entscheiden, welches System denn nun am besten auf Sie passt.

Das Problem

Manchmal ist das Chaos in der Datenbank sogar größer als das im Depot. Klingt irgendeiner der folgenden Punkte vertraut?

  • Die gleiche Information findet sich in verschiedenen Feldern, je nachdem, wer da dokumentiert hat.
  • Eine Menge Datensätze sind nur zum Teil ausgefüllt und die Information wiederspricht oft dem, was sich in den übrigen Unterlagen findet.
  • Einige Objekte haben mehr als einen Datensatz während andere gar keinen Eintrag haben.
  • Die Daten werden uneinheitlich eingegeben, Sie haben also zum Beispiel eine “Wasserpumpenzange”, eine “Rohrzange”, einen “Engländer” und eine “Sperrzahnzange” und sie bezeichnen alle die gleiche Art von Werkzeug.
  • Schreibfehler und inkonsistente Daten machen es unmöglich, exakte Suchergebnisse aus der Datenbank zu bekommen.

Es ist natürlich verführerisch, diese Dinge zu korrigieren, wenn Sie gerade ohnehin ein Objekt bearbeiten und ich sage auch gar nicht, dass das eine schlechte Idee ist. Aber wenn Sie wirklich voran kommen und Ihre Datenbank insgesamt in einen besseren Zustand bringen wollen, dann müssen Sie einen etwas strategischeren Weg einschlagen.

Das Problem: Während Sie dabei sind in aller Stille einige uneinheitliche Dateneinträge gerade zu rücken, erzeugen andere schon wieder schlampige Datensätze. Als allererstes müssen Sie sich also Gedanken machen, wie Ihre Felder denn nun wirklich genutzt werden sollen. Sie denken vielleicht, dass das ganz klar ist, aber ist es das wirklich? Und haben Sie das auch mal aufgeschrieben?

Erster Schritt: Was soll wie wo hin?

Ihr erster Schritt ist also gar nicht, das in Ordnung zu bringen, was schon da ist, sondern, dafür zu sorgen, dass die Datenbank genau so verwendet wird, wie Sie das möchten. Um das zu erreichen erstellen Sie ein Dokument mit allen Feldern in Ihrer Datenbank und wie diese jeweils befüllt werden sollen.

Seien Sie dabei so präzise wie möglich. Wenn Sie z.B. beim Feld „Beschreibung“ nur vermerken „eine Beschreibung des Objektes“ dann haben Sie nachher ein Freitextfeld dessen Inhalt von vagen Einträgen wie „Brautkleid“ bis hin zu zwei Seiten kopiertem Wikipedia-Artikel zur Geschichte der Brautmoden variiert. Also formulieren Sie genau, wie die Beschreibung aussehen soll.

Beispiel: Objektbeschreibung

„Der erste Satz soll die Objektart, Hauptfarbe und wichtige Unterscheidungsmerkmale enthalten. Denken Sie dabei daran, wie Sie das Objekt jemandem beschreiben würden, der es ohne Foto im Depot finden muss. Anschließend können Sie ein paar weitere Sätze zu besonderen Merkmalen schreiben, die das Objekt von anderen Objekten des gleichen Typs unterscheidet. Denken Sie dabei an Dinge wie ein besonderes Muster, einen Riss oder einen großen Fleck. Der Zweck dieses Feldes ist es, dass wir das Objekt eindeutig identifizieren können.”

Halten Sie auch fest, welche Informationen nicht in das Beschreibungsfeld, sondern in andere Felder in der Datenbank gehören, zum Beispiel:

„Eine Analyse des Objektzustands gehört in das Feld „Zustand”. Websites, die sich mit diesem Objekttyp befassen, gehören in das Feld „Weblinks“. Falls das Objekt in Ausstellungskatalogen erwähnt wurde, gehört der Literaturhinweis in das Feld „Bibliographie“. Bemerkungen zur Provenienz und frühere Besitzer*innen gehören in das Feld „Objektgeschichte“.“

Beispiel: Begriffe aus kontrollierten Vokabularen

Wenn Sie möchten, dass der Eintrag in einem Feld aus einem kontrollieren Vokabular genommen wird, dann ist es manchmal genug zu schreiben „wählen Sie den passenden Eintrag aus der Klassifikation aus dem Drop-Down-Feld“.

Andere Fälle sind komplexter und die Menschen, die die Einträge machen brauchen ein paar Hilfestellungen mehr. „Benutzen Sie nur Begriffe aus Nomenclature (Standardwerk zur Erfassung von menschengemachten Objekten, das in den U.S.A. viel verwendet wird, Anmerkung der Übersetzerin)“ sollte zumindest mit einem Link zur offiziellen Website https://page.nomenclature.info/ und ein paar Beispielen versehen sein.

Wenn Sie möchten, dass die Begriffe aus einer komplexeren Quelle genommen werden, zum Beispiel für das Material aus dem Art & Architecture Thesaurus (AAT) des Getty Research Institute, dann ist ein Hinweis wie „benutzen Sie nur Begriffe aus dem AAT“ bei weitem nicht genug. „Dieser Begriff soll dazu dienen, die Materialien festzulegen, aus denen das Objekt gemacht ist. Deshalb sollten Sie sie aus dem Zweig “Material nach Zusammensetzung” (materials by composition) des AAT nehmen.“ Fügen Sie auch Beispiele an, damit wer auch immer in Zukunft ein Objekt dokumentiert weiß, was Ihre Idee bei der Befüllung des Feldes war und wie ein korrekter Eintrag aussieht.

Grundprinzip: Aber finde ich es denn auch?

Ihre Leitlinie bei der Entscheidung, wie Sie Ihre Daten denn nun erfassen möchten sollte der Gedanke sein, wie Sie denn danach suchen werden. Das hängt natürlich einerseits von sauberen Daten ab,  aber andererseits auch davon, welche Suchfunktionen Ihre Datenbank bietet. Wortreiche Einträge in Freitextfeldern haben oft eine Menge unsinniger Suchergebnisse zur Folge. Indem man die Einträge in diesen Feldern kurz und bündig hält und zusammengehörige Informationen sinnvoll in verschiedenen Feldern zusammenfasst können Sie viel präziser suchen – Wenn Ihre Datenbank die Möglichkeit bietet, diese Felder getrennt zu durchsuchen und passend zusammenzufassen.

Also denken Sie bei jedem Feld, das Sie aufschreiben darüber nach, wie ihr „zukünftiges Ich“ dies Information finden kann. Das hilft sehr dabei nichts Wichtiges zu übersehen.

Zweiter Schritt: Aber funktioniert das überhaupt?

Nachdem Sie jetzt das alles aufgeschrieben haben, überprüfen Sie sich selbst. Erfassen Sie einige Objekte nach Ihren eigenen Vorgaben. 10-20 Objekte sind eine gute Auswahl. Stellen Sie dabei sicher, dass es sich um eine repräsentative Auswahl handelt. 10 Teller zu dokumentieren wird Sie nicht weiterbringen. Wenn Sie einen Teller, ein Kleid, ein Spielzeug, ein Werkzeug, ein Rundfunkgerät und einen ausgestopften Dachs erfassen, haben Sie eine große Bandbreite. Ihr Sammlungskonzept wird Sie bei der Auswahl unterstützen. Alle Objekttypen, die Ihnen in der Sammlung begegnen könnten, sollten mit Ihrer neuen Schreibanweisung einfach zu dokumentieren sein.

Während Sie Ihre Auswahl erfassen, werden Sie feststellen, dass Sie manche Felder vergessen haben und manche nicht auf alle Fälle passen. Vielleicht müssen Sie andere Felder verwenden. Oder vielleicht müssen Sie weitere hinzufügen, falls Ihre Datenbank das zulässt. Vielleicht müssen Sie einfach nur genauer beschreiben, wie manche Informationen unterschiedlich in das gleiche Feld eingegeben werden sollen, je nachdem um welche Objektgruppe es geht.

Anpassen und teilen

Passen Sie Ihr Dokument und/oder Ihre Datenbank so an, dass Sie wirklich alles inventarisieren können, was in Ihre Sammlung kommen kann. Wenn Sie mit dem Ergebnis zufrieden sind, verbreiten Sie das Dokument, das Sie nun vielleicht „Schreibanweisung für die Objekterfassung“ oder „Hilfe zur Dokumentation“ nennen, unter allen Leuten, die die Datenbank verwenden, nicht nur unter denen, die tatsächlich Objekte erfassen. Das Dokument wird nämlich auch denjenigen, die die Datenbank nur zu Recherchezwecken verwenden helfen die für sie relevanten Objekte zu finden.

Aber ich habe gar keine Datenbank!

Wenn Sie bislang noch keine Datenbank haben, sondern nur eine Ansammlung von Dateien aus Ihrem Tabellenkalkulationsprogramm oder einen Haufen Karteikarten, hilft eine solche Schreibanweisung trotzdem weiter. Machen Sie ein paar Testinventarisierungen in einer Tabelle, die alle Ihren gewünschten Felder enthält. Das wird Ihnen dabei helfen zu entscheiden, was Ihr neues System alles können muss. Außerdem können Sie diese Tabelle dazu verwenden, Ihre Sammlung jetzt nach den Vorgaben aus Ihrer Schreibanweisung zu erfassen. Später haben Sie dann die Daten schon in einer sauberen Form, um sie in Ihr neues System zu importieren.

Und weiter geht es mit der Bekämpfung des Chaos

Wenn Sie an diesem Punkt sind haben Sie etwas unglaublich tolles geschafft: Von jetzt an bekommt alles, was Sie in Ihrer Datenbank erfassen einen sauberen Datensatz, der sich einfach auffinden lässt. Manchmal müssen vielleicht noch kleine Anpassungen an Ihrer Schreibanweisung vorgenommen werden aber im Großen und Ganzen wissen jetzt alle, wie Daten zu erfassen sind und wenn Sie entdecken, dass es jemand nicht weiß, dann können Sie anhand des Dokuments erklären, wie es denn nun richtig gemacht wird. Neuen (egal ob haupt- oder ehrenamtlichen) Kolleg*innen zu erklären, wie in Ihrem Haus inventarisiert wird, ist nun sehr viel einfacher geworden.

Jetzt können Sie damit beginnen, den Rest der Datenbank in einen besseren Zustand zu bringen.

Welche Art von Saustall haben Sie?

Datenbankchaos ist nicht gleich Datenbankchaos. Manchmal ist die Grundsubstanz des Datensatzes okay, Sie brauchen nur ein paar kleine Anpassungen und Korrekturen hier und da. In anderen Fällen ist es so schlimm, dass Sie diese Datensätze unter Quarantäne stellen müssen, zum Beispiel, indem Sie sie in eine eigene Abteilung verschieben, mit einer Checkbox kennzeichnen oder eine spezielle Klassifikation „veralteter Datensatz“ vergeben, so dass Sie diese Datensätze zwar als Referenz heranziehen können, aber den Objekten einen neuen, sauberen Datensatz geben.

Neue Datensätze für altes Zeug

Falls Sie es mit letztgenannter Möglichkeit zu tun haben, dann haben Sie nun Ihre Schreibanweisung, der Sie folgen können. Sie können in ihren alten Datensätzen nachsehen, ob Sie irgendeine Information übersehen haben. Manchmal gibt es dort Hinweise zu Spendern, die sich nicht in den Unterlagen finden lassen. Vermerken Sie das in Ihrem neuen Datensatz mit dem Zusatz “Laut altem Datensatz Nummer…“ so dass klar ist, woher diese Information stammt und dass sie eventuell noch verifiziert werden muss. Manche Systeme lassen es zu, dass Sie eine Verknüpfung mit dem alten Datensatz herstellen und es könnte schlau sein, diese Möglichkeit zu nutzen.

Bestehende Datensätze Schritt für Schritt verbessern

Wenn Sie entscheiden, dass Ihre bestehenden Datensätze gar nicht sooo schlecht sind, dass sie nur hier und da ein bisschen Verbesserung vertragen können, sollten Sie diese Aufgabe in kleinere, schaffbare Teilaufgaben unterteilen. Viele Datenbankdurcheinander sind entstanden, weil jemand mit guten Absichten mit dem Aufbau angefangen hatte, die Arbeit dann aber es dann nicht zu Ende bringen konnte. Dann haben Nachfolger*innen übernommen, ohne zu verstehen, was die Vorgänger*innen denn da getrieben haben oder eigentlich vor hatten.

Da Sie das wissen, erstellen Sie natürlich ein Dokument mit einer Strategie zur Datenbankverbesserung, so dass, wenn Sie aus irgendeinem Grund aufhören müssen, ihre Nachfolger*innen wissen, was Sie getan haben und warum.

Meistens ist es einfacher, sich auf ein einzelnes Feld zu konzentrieren und das dann durchgängig durch die ganze Datenbank zu korrigieren, statt alle Felder eines Datensatzes zu korrigieren. Da die Aufgabe so repetitiv ist, geht sie nach einiger Zeit relativ schnell. Um ein Beispiel zu nennen: nehmen Sie alle Werkzeuge zusammen und schauen Sie, ob sie den richtigen Eintrag aus dem Materialthesaurus haben, normalerweise also „Holz“ oder „Metall“, manchmal auch beides. Dann machen Sie mit den Haushaltsgegenständen weiter, wo Sie genau das gleiche machen. Oder bleiben Sie bei Ihren Werkzeugen, aber dieses Mal bringen Sie die Klassifizierungen in Ordnung, so dass alle „Steckmeißel“, „Schnitzmeißel“, „Stechbeitel“ und „Stemmeisen“ als „Meißel“ gefunden werden können. Sie können dann noch Unterklassifizierungen nach Anwendungsgebiet oder Form bekommen. In kürzester Zeit sind Sie plötzlich Expert*in für unterschiedliche Meißelarten geworden, so dass Sie viel schneller beim Klassifizieren werden.

Praktikant*innen und Ehrenamtliche mit einbeziehen

Es ist ziemlich einleuchtend, dass einige dieser Aufgaben an ausgewählte Ehrenamtliche oder Praktikant*innen vergeben werden können. Wenn sie ein gutes Auge für Details haben, dann sollten sie sehr gut dazu in der Lage sein, einige dieser Korrekturen zu übernehmen. Und da sie dann ja nur einen überschaubaren Bereich in einer bestimmten Objektart zu einer bestimmten Zeit korrigieren, sind die Ergebnisse viel einfacher und schneller zu kontrollieren als wenn Sie darum gebeten hätten, ein Objekt komplett neu zu erfassen.

Passen Unterlagen und Datenbank zueinander?

Genau auf die gleiche Art, wie Sie Material und Klassifizierung überprüft haben, können Sie in einem Schritt Ihre Unterlagen durchgehen und überprüfen, ob denn nun auch alles, für das es einen Schenkungsvertrag gibt auch als Schenkung erfasst wurde und alles, was eine Rechnung hat auch wirklich als Ankauf auftaucht. Wieder arbeiten Sie die Aufgabe in Schritten ab, die Sinn ergeben, in diesem Fall vielleicht Aktenordner für Aktenordner oder Jahrgang für Jahrgang, je nachdem wie Ihre Unterlagen geordnet sind.

Im Ergebnis haben Sie vielleicht eine Menge Objekte ohne Unterlagen und auf der anderen Seite eine Menge Papierkram, der irgendwie nicht so recht zu irgendetwas passen will, das Sie in Ihrem Depot haben. Stellen Sie sicher, dass Ihre Datenbank auch ein Feld dafür hat, solche Dinge wie „kein Schenkungsvertrag vorhanden“ zu erfassen. Und natürlich enthält Ihre Schreibanweisung auch einen Vermerk, wie dieses Feld ausgefüllt werden soll.

Das ultimative Ziel: Die Schatzkiste

Ihr ultimatives Ziel ist es, dass Ihre Datenbank zu Ihrem verlässlichen Freund wird. Wenn auch alles andere ziemlich durcheinander ist, ist ihre Datenbank der Ort an dem Sie einen sauberen Datensatz haben, der Ihnen sagt, was Sie über dieses Objekt wissen – und manchmal auch, was Sie nicht darüber wissen. Ihre Datenbank wird zu Ihrem Referenzpunkt, während Sie die Sammlung in der physischen Welt verbessern.

Angela Kipp

#DatenStrukturieren #Datenbanken #Datenstruktur #Dokumentation #Museumsdatenbanken #Sammlungsverwaltung #Sammlungsverwaltungssysteme #Schreibanweisung

Newsletters – Registrars Committee Western Region

Registrars Committee Western Region

Städte sollten offene #Datenmodelle verfolgen. Nur mit ihnen ließe sich eine offene #Datenstruktur bereitstellen, die ihnen als komplexe, lebendige und vielfältige Phänomene gerecht wird, schreibt Aurel von Richthofen, Leiter des Cities Team bei Arup, in seinem #Standpunkt.

Jetzt lesen 👉 https://background.tagesspiegel.de/smart-city/linked-open-data-und-semantische-webtechnologien-als-chancen-fuer-stadtdaten?utm_source=mastodon.com&utm_medium=social&utm_campaign=mastodon&utm_content=sv+lesen

Linked Open Data und semantische Webtechnologien als Chancen für Stadtdaten

Tagesspiegel Background

"That is, loss of data might occur due to changes of the data structures beneath."

https://gitlab.com/dialogium/cosum

#Struktur - #Datenstruktur; #Plattform #Speicherproblem

michael / cosum · GitLab

GitLab.com

GitLab