Wie können wir mit digitalen Methoden preußische Verwaltungsdiskurse des 19. Jahrhunderts erschließen? 🔍

Felix Selgert & Alexander Ermakov zeigen in ihrem #DigHis23-Paper anhand verschiedener #TopicModeling-Algorithmen, wie die Verfahren zur Quellenerschließung und -analyse eingesetzt werden können.

🗞️ Zum Paper: https://doi.org/10.5281/zenodo.8428178

____
#DigitalHistory #DigitalHumanities #histodons #TextMining

Der Verwaltungsdiskurs in der preußischen Regionalverwaltung im frühen 19. Jahrhundert. Eine Topicmodellierung der Immediatzeitungsberichte

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: Dieser Beitrag untersucht exemplarisch für den Regierungsbezirk Düsseldorf im Jahr 1817, welche latenten Berichtskategorien in den Immediatzeitungsberichten dieses rheinischen Regierungsbezirks vorhanden waren. Bei den Immediatzeitungsberichten handelt es sich um Verwaltungsberichte der preußischen Regierungen, die direkt an den König adressiert, und somit immediat, waren. Der Ursprung dieses Quellentyps liegt im 18. Jahrhundert, nach dem Wiener Kongress wurden die Berichte bis zum Ende der Monarchie auch aus den neuen preußischen Provinzen erstattet. Der Fokus des Beitrags liegt dabei auf der Erprobung unterschiedlicher Topicmodellarchitekturen (LDA, sLDA, CTM und HDP) und Textkompilationen für den Quellentyp Verwaltungsbericht. Die handschriftlichen Verwaltungsberichte werden zunächst mit Hilfe von Transkribus transkribiert, digitalisiert und nach einzelnen Berichtskategorien und Monaten als .txt-files exportiert. Danach werden die Texte entlang verschiedener Achsen (Berichtskategorie, Witterungsperioden, Jahr) zusammengefasst und die latenten Themen der Berichte mit Hilfe unterschiedlicher Topicmodelle identifiziert und miteinander verglichen. Für nach Berichtskategorien vorsegmentierte Texte ergeben LDA und sLDA Modelle die am besten interpretierbaren Topics, vorausgesetzt das Vokabular ist hinreichend groß und die zu erfassenden Strukturen sind genügend ausgeprägt. HDP Modelle sind dagegen bei den aus allen Texten eines Jahres zusammengesetzten Dokumenten besser dazu in der Lage, zumindest einen Teil der Berichtskategorien sowie klar hervorstechende Strukturelemente (bspw. tabellarische Preisangaben) zu erfassen.

Zenodo

Digitale Spiele als Lern- und Lehrmittel?🕹️

Malte Grünkorn reflektiert in seinem #DigHis23-Beitrag anhand des Projekts & Entdeckungsspiels “#LastSeen. Bilder der NS-Deportationen” über die Potenziale von Spielen für institutionelle Gedenkprojekte.

🗞️https://doi.org/10.5281/zenodo.8322265

_____
#DigitalHistory #PublicHistory #DigitalHumanities #histodons #Erinnerungskultur

#LastSeen. Mit Fotos von NS-Deportationen spielen und dabei historisch lernen?

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: Der Beitrag möchte anhand des #LastSeen- Entdeckungsspiels über historische Fotos von NS-Deportationen die Herausforderungen und Potentiale digitaler Spiele für institutionelle Gedenkprojekte im digitalen Raum reflektieren. Mit geschichtsdidaktischen oder erinnerungskulturellen Zielsetzungen produzierte Spiele sind ein Versuch, im digitalen Raum eigensinniges historisches Lernen zu ermöglichen. Das im Beitrag vorgestellte #LastSeen-Entdeckungsspiel hat das Ziel, anhand von Fotos von NS-Deportationen, praktische Kenntnisse der Fotoanalyse auf eine spielerische Art und Weise zu vermitteln.

Zenodo

Wie kann die besondere "Materialität" digitaler Objekte entschlüsselt werden? 🧐

Daniel Gammenthaler setzt zur Beantwortung dieser Frage in seinem #DigHis23-Beitrag auf #ReverseEngineering, um digitale Medienartefakte, die heute in Archiven, Bibliotheken und Museen immer zahlreicher werden, quellenkritisch einzuordnen und zu analysieren.

🗞️ Zum Paper: https://doi.org/10.5281/zenodo.8322205

_____
#DigitalHistory #DigitalHumanities #histodons

Reverse Engineering von digitalen Medienartefakten

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: Die digitale Revolution hat Archive mit digitalen Medienartefakten gefüllt, deren Analyse traditionelle geschichtswissenschaftliche Methoden herausfordert. Der Beitrag positioniert Reverse Engineering als praktische Methodik zur Analyse solcher Artefakte, indem er auf Friedrich Kittlers (1992) Artikel, der die Hardware als einzige Materialität des Computers betrachtet, und dem ‚New Materialism‘ aufbaut. Eng mit Computergeschichte und Technikwissenschaften verknüpft, werden zwei methodische Ansätze vorgestellt: zum einen eine statische Analyse, bei der die Software entschlüsselt und analysiert wird, und zum anderen eine dynamische Analyse, bei der Instruktionen in einer Simulationsumgebung untersucht werden. Beide Methoden weisen Vor- und Nachteile auf. Reverse Engineering ist für diverse digitale Medienartefakte anwendbar und ermöglicht eine tiefergehende quellenkritische Perspektive. Dadurch können intrinsische Programmfunktionen analysiert sowie Aussagen über Inhalte, Handlungsfähigkeit und Autorenschaft getroffen werden. Dies trägt zu einem umfassenderen Verständnis von digitalen Medienartefakten und ihrer Rolle in der Geschichtsforschung bei.

Zenodo

🔖 Zum Wochenende gibt es wieder zwei neue Beitragsempfehlungen von der #DigHis23:

1️⃣ In welchem Verhältnis stehen technologischer Wandel & politische Diskurse? Dieser Frage widmet sich der Beitrag von Anselm Küsters. Mittels #SentimentAnalysis untersucht er die Diskurse zur Telekommunikation im Reichstag (1867-1942).
➡️ https://doi.org/10.5281/zenodo.8322284

1/2
_____
#digitalhistory #DigitalHumanities #histodons

Technological change and sentiment in German parliamentary speeches (1867-1942). An explanatory case study on telecommunication

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: This paper draws on sentiment analysis methods to examine the relationship between technological change and political discourse, using telecommunications as an example. Web scraping enables the construction of a digital corpus of all Reichstag speeches between 1867 and 1942 that mention telegraphs or telephones. On this basis, three popular German-language sentiment dictionaries - SentiWS, German Polarity Clues, and German Sentiment Dictionary - are compared regarding their effectiveness in evaluating historical and complex texts. In addition, a more refined metric for extracting sentiment information is proposed, based on machine learning techniques such as part-of-speech tagging and dependency parsing. Through intensive close reading, the resulting sentiment scores are validated, with mixed results. Sentiment analysis cannot provide precise quantification of historical feelings about telecommunication, but peaks and relative changes in the underlying scores over time help to identify interesting turning points in the debate as well as technology-sceptical outsider positions.

Zenodo

#KünstlicheIntelligenz trifft auf Geschichte! 💻

Der #DigHis23-Beitrag von Michela Vignoli, Doris Gruber, Rainer Simon und Axel Weißenfeld zeigt anhand des #ONiT-Projekts mit der Untersuchung verschiedener Repräsentationen von Natur, wie #KI-Methoden zur multimodalen Analyse von Text-Bild-Beziehungen in historischen Drucken eingesetzt werden können.

🗞️ Zum Paper: https://doi.org/10.5281/zenodo.8322398

____
#DigitalHistory #ArtificialIntelligence #AI #histodons #history

Impact of AI: Gamechanger for Image Classification in Historical Research?

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: AI opens new possibilities for processing and analysing large, heterogeneous historical data corpora in a semi-automated way. The Ottoman Nature in Travelogues (ONiT) project develops an interdisciplinary methodological framework for an AI-driven analysis of text–image relations in digitised printed material. In this paper, we discuss our results from the first project year, in which we explore the potential of multi-modal deep learning approaches for combined analysis of text and image similarity of “nature” representations in historical prints. Our experiments with OpenCLIP for zero-shot classification of prints from the ICONCLASS AI Test Set show the potential but also limitations of using pre-trained contrastive-learning algorithms for historical contents. Based on the results and our learnings, we discuss in which way computational, quantitative methods affect our underlying epistemology stemming from more traditional “analogue” methods. Our experiences confirm that interdisciplinary collaboration between historians and AI developers is important to adapt disciplinary conventions and heuristics for use in applied AI methods. Our main learnings are the necessity to differentiate between distinct visual features in historical images versus representations of “nature” that require interpretation, and to develop an understanding for the features an AI algorithm can be retrained to detect.

Zenodo

💡 Die Zahl frei verfügbarer Datensammlungen nimmt stetig zu, doch wie gut lassen sie sich für die historische Forschung nachnutzen? Paul Ramisch zeigt am Beispiel des Open Discourse-Korpus, einer Sammlung aller Redebeiträge des Deutschen Bundestages seit 1949, die Limitationen auf und betont die Relevanz der #Quellenkritik und #Datenkritik.

📄 Zum Paper: https://doi.org/10.5281/zenodo.8322330

#DigHis23 #DigitalHistory #histodons

Open Discourse - eine digitale Quellenkritik: Goldstandard-Korpus-Evaluation als Methode und epistemologische Konsequenzen

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: Die Zahl großer digitalisierter und genuin digitaler historischer Textkorpora hat in den vergangenen Jahren stark zugenommen. Das ermöglicht eine Vielzahl innovativer Untersuchungen. Gleichzeitig sind diese Datenmengen aber mit Herausforderungen für die Quellen- und Datenkritik verbunden. Am Beispiel des Open-Discourse-Korpus, einer (strukturierten) Sammlung aller Redebeiträge des Deutschen Bundestages seit 1949, erörtert der Beitrag diese Herausforderungen, die durch die Nutzung solcher umfangreichen Datenkorpora entstehen, und schlägt eine neue Methode der Quellen- und Datenkritik vor. Durch eine Stichproben-Untersuchung mithilfe eines Goldstandardkorpus wird gezeigt, dass dieser starke strukturelle Probleme aufweist und sich nur eingeschränkt für historische Forschungfragen eignet. Das Beispiel zeigt eindrücklich, wie wichtig es ist, die Limitierungen und potenziellen Verzerrungen automatisiert verarbeiteter Quellendatensätze und ihrer Modellierung zu berücksichtigen und mithilfe interdisziplinärer Ansätze quellenkritisch zu untersuchen.

Zenodo

📢 Im heutigen Beitrag zur #DigHis23 diskutiert @ChristianWachter die methodologischen Herausforderungen seines neuen Projekts zur Untersuchung der heterogenen Konzepte von #Demokratie in historischen Zeitungen der #WeimarerRepublik. Dazu bedient er sich mit dem #ScalableReading einer Kombination aus Close und #DistantReading.

📰 Zum Paper: https://doi.org/10.5281/zenodo.8322406

#DigitalHistory #histodons

Democracy and Uncertainty. Approaching a Heuristic Framework for Studying Political Discourse in the Weimar Republic

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: In this paper, I will discuss methodological challenges and considerations in the early stages of a research project on political discourse in the Weimar Republic. The project focuses on heterogeneous perceptions and definitions of democracy as visible in Weimar's newspapers. I will problematize that text mining might seem particularly helpful for coping with the textual masses of this serial primary source. However, primarily quantitative approaches tend to neglect essential political and social contexts, thus omitting what stands behind the concrete formulations on the text surface. On the other hand, purely qualitative examination tends to be too selective to scrutinize discourse at scale. Therefore, I will outline a framework of scalable reading: The alternating movement of zooming into the close reading perspective and zooming out to the large-scale level. My strategy is, at its core, qualitative, but it introduces quantitative explorations in an overall framework of methodological triangulation. This is inspired by other studies of scalable reading in contemporary history, whose approaches must be adapted to do justice to the specific conditions of Weimar’s complex political culture. I will outline my considerations and a proposal for scalable reading, which enters largely uncharted terrain in historical research on Germany’s first democracy. While this paper focuses on methodological considerations during the project's onset, I have reported on the project more extensively and with special regard to pro-democratic discourse here: Christian Wachter [in press], Capturing Discourse through the Digital Lens: Towards a Framework for the Analysis of Pro-Democratic Discourse in the Weimar Republic, in: Florentina Armaselu/Andreas Fickers (eds.), Zoomland: Exploring Scale in Digital History and Humanities, Berlin 2023 (Studies in Digital History and Hermeneutics, 7).

Zenodo

Gestern #Crowdsourcing, heute #CitizenScience:

Katrin Moeller & Georg Fertig stellen sich in ihrem #DigHis23-Beitrag der Frage, wie die Qualität von usergenerierten Datenbanken geprüft und verbessert werden kann. Am Beispiel der über 10,5 Mio. Adressbucheinträge des Vereins für Computergenealogie zeigen sie, wie spezialisierte, kontrollierte Vokabulare & #KI-Technologien dabei helfen, die Daten für die historische Forschung anzureichern.

📝 Zum Paper: https://doi.org/10.5281/zenodo.8322313

#DigitalHistory

Daten der Citizen Science für die Wissenschaft? Kontrollierte Vokabulare als Herausforderung und Chance für die Auswertung und Qualitätsverbesserung von Massendaten. Die crowdbasierte Datensammlung von Adressbucheinträgen des Vereins für Computergenealogie im Qualitätstest

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: Der Artikel beschäftigt sich mit der wissenschaftlichen Verwendung, Qualitätsprüfung und Anreicherung von usergenerierten, webbasierten Datenbanken. Am Beispiel der 10,5 Mio. Einträge umfassenden Adressbuchdatenbank des Vereins für Computergenealogie wird erörtert, welche Vor- und Nachteile normierte und nichtnormierte Dateneingaben besitzen. Anhand des Geschichtlichen Ortsverzeichnisses (GOV) und der Ontologie der historischen, deutschsprachigen Amts- und Berufsbezeichnungen (OhdAB) wird demonstriert, welche Bedeutung kontrollierte Vokabulare, Normdaten und Taxonomien für die Auswertung von Massendaten besitzen und welche Herausforderungen sich beim Matching mit verschiedenen KI-Technologien ergeben. Anhand einiger Ergebnisse wird gezeigt, dass Vokabulare eine hervorragende Möglichkeit bieten, Daten anzureichern und zu kontextualisieren. Gleichzeitig ergänzen sie KI-Verfahren mit ihren eher auf Distant Reading-Strategien (Mustererkennung) ausgerichteten Analysemöglichkeiten um Verfahren des Close Readings und unterstützen damit gezielt die Beantwortung von Fragestellungen analog zu hermeneutischen Strategien.

Zenodo

📌 Im heutigen #DigHis23-Paper wirft Ian Kisil Marino einen kritischen Blick auf die Produktion digitaler Archive zur COVID-19-Pandemie in #Lateinamerika. Dabei weist er auf bestehende Defizite hinsichtlich Fragen der Repräsentation und digitalen Langzeitarchivierung hin. Ein Must-Read für alle, die sich für #Crowdsourcing und die aktuellen Herausforderungen in diesem Bereich interessieren.

🔖 Zum Paper: https://doi.org/10.5281/zenodo.8319680

#DigitalHistory #LZA #DigitalHumanities

Promises and pitfalls of crowdsourcing based on COVID-19 digital archives in Latin America

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: This paper reflects on crowdsourcing by analyzing the creation of digital archives regarding the COVID-19 pandemic in Latin America. In doing so, the paper contributes to existing literature by demonstrating empirical evidence that highlights two important shortages in the crowdsourcing literature within the humanities – namely issues of representation and digital preservation. Both aspects relate to global inequality, which is why the Latin American scope is so important for understanding these deficiencies. The first part of the paper debates the stakes of crowdsourcing within the humanities. Additionally, it problematizes the guidelines and principles previously used to evaluate crowdsourcing’s outcomes in the field of born-digital archives regarding unpredictable and disruptive events. The second part of the paper briefly presents the COVID-19 archives in Latin America as an applicable case study, which is especially important when it comes to debating representation, diversity, and preservation of born-digital records.  

Zenodo

📢 Neue Woche, neue #DigHis23-Beiträge:

Friederike Schmidt zeigt in ihrem Paper, wie sich die Aneignungspraktiken indigener Kulturgüter Australiens durch die quantitative & qualitative Analyse europäischer Museumssammlungen erforschen lassen und welche (proto-)wissenschaftlichen, männlich geprägten Narrative dabei die Kategorisierung und Verteilung der Sammlungsobjekte beeinflussten.

🔖 Zum Paper: https://doi.org/10.5281/zenodo.8322365

#DigitalHistory #PostcolonialStudies

Das Quantitative Ausmaß europäischer Aneignungspraktiken indigener Kulturgüter Australiens. Eine Genderperspektive

Ein Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: Die quantitative Dimension der personellen und institutionellen Strukturen europäischer Aneignungspraktiken indigener Kulturgüter Australiens ist bisher wenig erforscht. Diese Studie untersucht erstmalig das Ausmaß europäischer Museumssammlungen unter Anwendung eines mixed-methods-Ansatzes. Der für diesen Zweck eigens erhobene EMCAM-Datensatz enthält Informationen zu 4.862 indigenen Kulturgütern aus den 13 größten nationalen Sammlungen der EU-Mitgliedstaaten. Die standardisiert erhobenen Daten enthalten darüber hinaus Informationen zu 101 sogenannten „Sammler:innen“, die sich die Kulturgüter während der britischen Kolonialherrschaft in Australien angeeignet haben. Mit Hilfe der quantitativ-empirischen Analyse werden problematische latente Quantifizierungen gezielt auf die Probe gestellt und durch manifeste Zahlen ersetzt. Eine anschließende qualitativ vergleichende Genderperspektive auf die „Sammler:innen“ Daisy May Bates und Eric Mjöberg diskutiert das spätestens seit den 1890er-Jahren verstärkt (proto-)wissenschaftlich argumentierte Narrativ des „gefährlichen Wilden“ als einen möglichen Erklärungsansatz für die vorherrschende Verteilung der Objektkategorien. Dieses Narrativ war im doppelten Sinne männlich geprägt. Zum einen war Wissenschaft und die akademische Ausbildung in erster Linie privilegierten Männern vorbehalten und zum anderen reduziert das Narrativ die komplexen sozioökonomischen Strukturen einer Kultur auf ihre männliche Hälfte der Gesellschaft, welches durch den selbst heraufbeschworenen confirmation-bias bis heute in der völkerkundlichen Museumssammlungen konserviert ist.

Zenodo