Sprichwörter bildlich gesehen (Teil 1)

Wer Sprichwörter benutzt, hat für sich selbst dazu ein inneres Bild – und hofft darauf, dass sein Gegenüber das gleiche, oder zumindest ein stark ähnliches inneres Bild hat. Sprichwörter sind kurze Metapher für Zusammenhänge, die dank des Hintergrundwissens, dass man im jeweiligen Sprachraum voraussetzen kann, als zeitsparende Kommunikations-Codes dienen. Sprichwörter können sehr einfach, aber auch sehr komplex in ihrer Auslegung sein. Sprichwörter sind für mich an dieser Stelle aber vor allem ein interessantes Experimentierfeld bei der Verwendung bildgenerierender KI: Der Visualisierung des inneren Bildes zum jeweiligen Sprichwort.
Da dies ein vorhersehbar weites Feld ist, bekommt dieser Beitrag den Zusatz „(Teil1)“.

Sprichwörter sind stark abhängig vom Sprachraum, in dem sie verwendet werden. So gibt es durchaus Sprichwörter, die einen bestimmten Sachverhalt in einem bestimmten Sprachraum mit einer bestimmten Metapher ausdrücken – und verstanden werden. Übersetzt man dieses Sprichwort wörtlich, erreicht man aber in anderen Sprachen oft Unverständnis. Interessant dabei: Zum benanntem Sachverhalt gibt es durchaus ein passendes Sprichwort in der anderen Sprache, doch es benutzt eine andere Metapher.
Es ist also nicht einfach mit den Sprichwörtern …

Das KI-Modell, was ich hier verwende, wurde wahrscheinlich hauptsächlich im englischen Sprachraum trainiert. Ich finde es interessant, zuerst einmal zu schauen, was die KI mit meinem recht kurzen Prompt anfangen kann:

Gestalte mir ein lustiges Sinnbild zum deutschen Sprichwort „Den Letzten beißen die Hunde“.

Drei von den vier Bildern kann man schon mal vergessen. Das erste Bild habe ich mir wahrscheinlich mit dem Zusatz „lustiges“ selbst vermasselt. Wären es keine Hunde im Comic-Stil, wäre ich schon zufrieden. Aber ich wollte es ja lustig …

Nun also ein Prompt, das ausführlicher meine Bildidee beschreibt:

Eine Gruppe junger Leute flüchtet vor einer Hundemeute. Einer der Flüchtenden kann nicht schnell genug rennen, so dass ihn ein Hund aus der Meute ins Bein beißen kann. Das Bild ist insgesamt ein lustiges Sinnbild zum deutschen Sprichwort „Den letzten beißen die Hunde“.

(Ja, ich will es immer noch lustig!)

Ja, und nun? Schöne, sympathische, lustige Bilder – aber nix mit beißen, verfolgen oder flüchten. Was es bedeutet, der Letzte in einer Gruppe zu sein, die verfolgt wird, übersteigt offensichtlich die Vorstellungskraft der KI. (Und Golden Retriever sind die ultimativen Sympathie-Träger?)

Also gestalte ich meinen Prompt noch genauer:

Im linken Bildbereich ist eine Gruppe ängstlich flüchtender Leute zu sehen. Sie rennen nach links. Im mittleren Bildbereich sieht man einen Flüchtenden, der von einem Hund ins Bein gezwickt wird. Im rechten Bildbereich sieht man eine rennende Hundemeute in Laufrichtung nach links. Insgesamt ist es ein dynamisches, lustiges Bild.

(Ja, ich will es weiterhin lustig! Den Begriff „beißen“ ersetze ich bewusst durch „zwicken“, weil ich ahne, dass die innere Zensur der KI das eher zulässt.)

Die KI hält sich überhaupt nicht an meine Vorgaben zur Bildaufteilung. Weiterhin gibt es keine Visualisierung des Aspektes „Verfolgung“. Und gezwickt wird erst recht nicht. Eher durchdringt ein Hundekopf das Knie eines „Flüchtenden“, das ist ja nicht so schlimm … ?

Wiederholt habe ich den Eindruck, dass die erste Umsetzung der Bildidee eigentlich die beste war.
Der Rest ist Bilderlotto. Ich muss mir weitere Herangehensweisen neu überlegen. (Und bestimmt auch noch andere KIs ausprobieren.)