Jetzt in #BriefeImLabor:
Martin Prell (Klassik-Stiftung Weimar), Hans Clausen (FDH Frankfurt)
Briefdaten im Goethe-Biographica-Projekt: Möglichkeiten und erste Analysen eines entstehenden Data Warehouse
Jetzt in #BriefeImLabor:
Martin Prell (Klassik-Stiftung Weimar), Hans Clausen (FDH Frankfurt)
Briefdaten im Goethe-Biographica-Projekt: Möglichkeiten und erste Analysen eines entstehenden Data Warehouse
Goethe. Propyläen: https://goethe-biographica.de
Gedruckte und digitale Informationen sollen zusammengeführt werden.
Über 12.000 Briefe von/an Goethe, Tagebucheinträge, Begegnungen & Gespräche etc. sind derzeit online. Rund 90.000 sollen es am Ende des Akademienvorhabens sein.
@mprell: Herausforderung beim Goethe-Projekt: die heterogenen Informationen aus den vier Teilprojekten.
Interessant ist der erste Prototyp und Versuch von Hans Clausen für ein Dashboard auf den Goethe-LOD-Infos.
Dafür werden die TEI-XML-Daten in eine LOD-Repräsentation transformiert. Das Modell basiert auch auf CIDOC-CRM ...
Für #BriefeImLabor hat sich @mprell mal anhand der Goethe-Daten mit einem Tool von Ahnert et. al angeschaut, wie fehlende Daten sich auf das Ergebnis der Netzwerkanalyse auswirken. Tatsächlich bleiben die Charakteristika des Netzwerks auch weitgehend erhalten, wenn große Teile an Daten rausgenommen werden.
Aline Deicke fragt in der Diskussion, wie sich fehlende Daten für die "kleinen" Korrespondenzpartner:innen auswirken, ob der Effekt hier nicht größer/negativer ist.
@mprell: Müsste man sich das Ranking mal genauer anschauen nach dem Entfernen von Daten.