I have asked Claude Opus 4.6 (via GitHub Copilot Chat) to summarize various approaches to XML-plaintext-NLP-XML roundtripping, providing it with the respective GitHub repositories (listed in the report).

Claude finds FIVE different approaches. IMHO, in some cases I think it misses where it should have gone into details, but for an overview it is quite good. What do you think?

https://pad.gwdg.de/wwNnTvaETHKuzFiyhIYHog?view#Response-Report-Approaches-to-XML%E2%86%94Plaintext-Conversion-with-Annotation-Preservation

@eeditiones @davidlassner @TEIConsortium
@aboutgeo @cmboulanger

#TEIXML #NLP #StandoffAnnotation #TEIPublisher #Recogito

(TEI) XML plaintext Roundtripping Review - HedgeDoc

@dhd-blog.org Vielen Dank für den Bericht. Toller Hinweis auf viele, für mich, neue APIs und spannende Projekte. Der Link zum Ahiqar Projekt ist allerdings falsch (bzw. hat sich geändert?). Dieses findet sich unter https://ahiqar.uni-goettingen.de und ein Beispiel für ihr wirklich eindrückliches Interface ist https://ahiqar.uni-goettingen.de/arabic.html?tido=m0_i1_s0-1-2-3-4_p0.0-1.0-2.0-3.0-4.2.

#APIs #DSE #DigitalScholarlyEditions #Arabic #TEIXML

Ahiqar

Ahiqar - The Syriac and Arabic Ahiqar Texts

Hei #DigitalScholarlyEditions #TEIXML crowd!

🙋 I have a question for you: have you ever used the #Unicode symbol for insertion of a character or word into a text, U+2380 ⎀?

Or how would you encode the insertion mark in a text?

In the #OscarMamen pocket diaries, the insertion mark is used frequently and I would like to encode it somehow.

Suggestions? Examples?

I feels that I cannot get any good results googling anymore: #Enshittification of the search engine, I guess...

We are super excited to go to #Lisbon for #DH2025 & have the chance to talk about "Formalizing <interp>retation in #TEIXML through #RDFa". 🤩

@ACDHCH_OeAW @oeaw @fwf @dh2025 @TEIConsortium @w3c

Kudos to @TEIConsortium for the latest release of #TEIXML P5 4.9.0!

The QhoD team is proudly announcing the presentation of the next big chunk of Habsburg-Ottoman relations documents: The #GraViz project edits Grand Vizierial correspondence (1560s to 1760s) from the archives in Vienna and Istanbul.

GraViz project presentation
2025-01-28 at 18:00 CET at the #IHB of the #OeAW, Georg-Coch-Platz 1, 1010 Wien and on Zoom.

Details at https://www.oeaw.ac.at/ihb/detail/event/graviz-the-ottoman-grand-vizierate-1560s-1760s

Just another #TEIXML #DigitalEdition, featuring documents in German, Ottoman Turkish, Latin, Italian

GraViz: The Ottoman Grand Vizierate (1560s–1760s)

Projektpräsentation

Mit #TEIXML und #OpenRefine werden die Hofdiarien Johann Georgs II. (1656–1680) transkribiert, annotiert & analysiert. #Frequenzanalysen enthüllen höfische Kultur, politische Netzwerke & die Kunstgeschichte des #Barock – datenbasiert & maschinenlesbar:

https://saxorum.hypotheses.org/12311

#DigitalHistory #HTR

Digitale Vermessung der Hofgesellschaft. Die Hofdiarien Johann Georgs II. von Sachsen (1656-1680) als frühneuzeitliche Datenspeicher und Quelle der Digital History

Von Stefan Beckert Die Handschriftensammlung der Sächsischen Landesbibliothek – Staats- und Universitätsbibliothek Dresden (SLUB) beherbergt zahlreiche einzigartige Texte aus den Beständen der ehemaligen kurfürstlich-königlichen Bibliothek. Viele von ihnen sind heute als Digitalisate verfügbar. Darunter befinden sich auch einige Bände der … Weiterlesen →

Saxorum

Es geht wieder los, das #PraxislaborDigitalHumanities - Workshops zum ersten Kennenlernen von Methoden und Werkzeugen der Digital Humanities.

Dieses Semester starten wir mit #TeiXML am 14. und 21.11. Außerdem gibt es Workshops zur KI-gesteuerten Literaturrecherche und dem Managen von Forschungsdaten und und und....

Alle Workshops und weitere Informationen findet ihr unter: https://www.ub.uni-frankfurt.de/digitalhumanities/workshops.html #ubffm #DigitalHumanities

Digital Humanities - Workshops

@gvogeler thx for raising this to the #TEIXML list and the @TEIConsortium
@gvogeler `trait` in fact has att.datable (a person is two-legged until Jaws comes along).
`event` does not have `trait`, for reasons I cannot infer from the #TEIXML Guidelines. But traits need a key/value (actually label/desc) scheme (./ab also works, granted).
A few markup samples attached. I favour the currently valid solution (last example event) for such use cases where the dating is uncontested.