Ich saß schon in einer Talkshow, die genau das gefragt hat 🙄

@stekopf Das Bild zeigt eine Grafik mit dem Titel "Krautreporter" und einem Hintergrundbild einer Öl- oder Gasverarbeitungsanlage. Im Vordergrund steht ein Mann namens Rico Grimm, der als Klimareporter identifiziert wird. Der Text auf der Grafik lautet: "Deutschland überweist jedes Jahr 76 Milliarden Euro ins Ausland, um Öl und Gas zu kaufen. Aber Talkshows fragen: 'Energiewende - wer soll das bezahlen?'". Die Grafik kritisiert die Situation, dass Deutschland große Mengen an Öl und Gas aus dem Ausland importiert und dabei erhebliche finanzielle Mittel ausgibt. Die Frage nach der Finanzierung der Energiewende wird als unangemessen dargestellt.

Bereitgestellt von @altbot, privat und lokal generiert mit Ovis2-8B

🌱 Energieverbrauch: 0.251 Wh

@micr0 @stekopf @simonwehr was mir an dem generierten Text missfällt, ist dass er nicht nach "bezahlen?" aufhört, sondern noch seinen Senf dazugibt. Ich finde, ein ALT-Text soll beschreiben, nicht interpretieren und bewerten. @grimm

@KarlE

Ja, da ist die KI etwas über das Ziel hinausgeschossen.
Beim Hinterlegen des Alt-Text dann ggf. weglassen oder korrigieren.
Hab's selbst gleich nochmal angepasst.

@micr0 @simonwehr @grimm

@stekopf

Allerdings ist beim Alt-Bot überhaupt der Witz, dass du nachher den Text in die Beschreibung des Bildes im Post einfügst und *nicht*, dass sie irgendwo in den Antworten steht, da bringt sie nämlich nichts.

Wenn dir der Text zu lang oder zu ausführlich ist, kürzt du ihn eben vor dem Einfügen.

Deshalb ist es gut, dass der Bot ausführlich beschreibt. Ein Programm kann ja nicht wissen, was dir wichtig ist und dir auch nicht die Entscheidung abnehmen.

@KarlE @micr0 @simonwehr @grimm

@mina

IMO soll der #AltBot ja die Erstellung erleichtern, deshalb sollten möglichst direkt verwendbare Text generiert werden.
Das ist sicher zu idealistisch, aber der Korrekturbedarf sollte möglichst klein sein.

Das Korrekturlesen eines Alt-Text ist recht aufwändig - jedes vom Bot beschriebene Detail muß mit dem Bild abgeglichen werden.
Da ist ein beschreibender Satz schneller selbst geschrieben.

Vielleicht hilft da noch etwas Feintuning am Prompt für das LLM.

@KarlE @micr0 @simonwehr @grimm

@stekopf

Die Beschreibungen sind schon ziemlich gut, und "Bearbeiten" heißt meist "einen Teil löschen".

Gerade am Handy ist das Eingeben von längeren Texten echt mühsam, aber die Löschtaste zu benutzen, sollte den meisten Menschen nicht allzu schwerfallen.

Niemand erwartet die perfekte Beschreibung.

@KarlE @micr0 @simonwehr @grimm