Sehr schöne Präsentation zu automatischer Metadatenextraktion aus einem Korrespondenzkorpus von Sabrina Strutz (Graz).
Sorgfältige Arbeit/Evaluation mit kritischer Durchsicht der GT Daten (welche Informationen stecken aus der Printedition da drin, die aber aus dem Brief gar nicht entnommen werden können?), Aufschlüsselung von Ergebnisqualität nach Task (Autor-/Ortserkennung) und Phase (Erzeugung von Kandidaten und Bestimmung des endgültigen Vorschlags).
Qwen3-14B-Q6 als lokales Modell zwar schlechter als Sonnet 4.6 (welches sehr gute Ergebnisse liefert, aber auch am teuersten ist) und GPT 5.2, aber auch keine ganz schlechten Ergebnisse. (Und besser mit abgeschaltetem Reasoning!)
Alle Modelle haben Probleme, Schreibeorte aus dem Text zu erschließen, wenn sie nicht in der Datumszeile genannte werden.




