Ist es momentan überhaupt irgendwie möglich, in #LLM-responses Quellen anzugeben?
Momentan sind neuronale Netze mWn niemals bit-für-bit reproduzierbar, somit müsste man zumindest die Verwendung von ethischen und auf Wahrheit selektierten Quellen nachweisen können.
Nur wenn diese Modelle keine Blackboxes mehr sind, kann man über Ethik und Transparenz sprechen, oder nicht?
Trainingsdaten
Gerade bei der üblichen Länge von Tokens könnten Quellenangaben schwer werden.
Projekte wie #REUSE helfen, sind aber hier nicht geeignet.
Dann wiederum gibt es #LLMs, die ganze Skripte/Geschichten/Lieder ausspucken. Bei so einer Länge würde eine Quelle auch noch reinpassen.
Die technischen Möglichkeiten müssen ermittelt werden, und es muss dafür Gesetze geben, um gigantischen #Datendiebstahl, #Bias und #Misinformation zu verhindern. Denn das wird eben kosten.