Wie können wir mit digitalen Methoden preußische Verwaltungsdiskurse des 19. Jahrhunderts erschließen? 🔍
Felix Selgert & Alexander Ermakov zeigen in ihrem #DigHis23-Paper anhand verschiedener #TopicModeling-Algorithmen, wie die Verfahren zur Quellenerschließung und -analyse eingesetzt werden können.
🗞️ Zum Paper: https://doi.org/10.5281/zenodo.8428178
____
#DigitalHistory #DigitalHumanities #histodons #TextMining
Der Verwaltungsdiskurs in der preußischen Regionalverwaltung im frühen 19. Jahrhundert. Eine Topicmodellierung der Immediatzeitungsberichte
Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: Dieser Beitrag untersucht exemplarisch für den Regierungsbezirk Düsseldorf im Jahr 1817, welche latenten Berichtskategorien in den Immediatzeitungsberichten dieses rheinischen Regierungsbezirks vorhanden waren. Bei den Immediatzeitungsberichten handelt es sich um Verwaltungsberichte der preußischen Regierungen, die direkt an den König adressiert, und somit immediat, waren. Der Ursprung dieses Quellentyps liegt im 18. Jahrhundert, nach dem Wiener Kongress wurden die Berichte bis zum Ende der Monarchie auch aus den neuen preußischen Provinzen erstattet. Der Fokus des Beitrags liegt dabei auf der Erprobung unterschiedlicher Topicmodellarchitekturen (LDA, sLDA, CTM und HDP) und Textkompilationen für den Quellentyp Verwaltungsbericht. Die handschriftlichen Verwaltungsberichte werden zunächst mit Hilfe von Transkribus transkribiert, digitalisiert und nach einzelnen Berichtskategorien und Monaten als .txt-files exportiert. Danach werden die Texte entlang verschiedener Achsen (Berichtskategorie, Witterungsperioden, Jahr) zusammengefasst und die latenten Themen der Berichte mit Hilfe unterschiedlicher Topicmodelle identifiziert und miteinander verglichen. Für nach Berichtskategorien vorsegmentierte Texte ergeben LDA und sLDA Modelle die am besten interpretierbaren Topics, vorausgesetzt das Vokabular ist hinreichend groß und die zu erfassenden Strukturen sind genügend ausgeprägt. HDP Modelle sind dagegen bei den aus allen Texten eines Jahres zusammengesetzten Dokumenten besser dazu in der Lage, zumindest einen Teil der Berichtskategorien sowie klar hervorstechende Strukturelemente (bspw. tabellarische Preisangaben) zu erfassen.