„in the style of“ – Bild-KI als Anlass für Bilduntersuchungen im Fach Kunst

Anmerkung: Dieser Beitrag möchte lediglich Denkanstöße auf fachdidaktischer Ebene geben und keine methodische Handlungsanweisung für den Unterricht sein. Bitte sorgen Sie bei einer konkreten Umsetzung der skizzierten Szenarien in Ihrem Unterricht selbst für entsprechende Datenschutzkonformität Ihres Handelns und aller eingesetzten Anwendungen. Alle im Text genannten Anwendungen wurden exemplarisch gewählt, um fachdidaktische Potenziale von Text-to-Image-Verfahren im Allgemeinen aufzuzeigen.

Bild-KI können Bilder im Stil einer bekannten Künstlerin oder eines bekannten Künstlers generieren. Dass die KI-Modelle dabei lediglich samplen, also aus Teilen bereits existierender Bilder neue Bilder montieren, ist bei Text-to-Image-Verfahren allerdings in der Regel nicht der Fall. Vielmehr lernen die Modelle Konzepte von Bildmotiven und -inhalten, die sie dann passend zu den jeweiligen Prompts reproduzieren. Das könnte sie wiederum zu einem interessanten Untersuchungsinstrument für die Beschäftigung mit Werken der Kunst, aber auch mit anderen Bildern machen. Textprompts bestehen aus verschiedenen Attributen, die sich beispielsweise auf Motiv, Medium, Technik, Genre, Stimmung, Farbton, Beleuchtung und einiges mehr beziehen können, deren Zusammenspiel das Bild formt. Der Prompt-Teil „in the style of“ könnte somit zum Ausgangspunkt für die Erkundung künstlerischen Stils und künstlerischer Bildkonzepte werden – in Bezug auf einzelne Personen, aber auch auf ganze Stilrichtungen und Epochen.

Lässt man beim Prompten das Motiv aus und gibt lediglich Informationen zum Stil ein, kann man etwas von dem Konzept herauskitzeln, das sich das jeweilige Modell auf Grundlage der Trainingsdaten von dem gebildet hat, was die Werke der jeweiligen Person ausmacht. Dabei entsteht dann – je nach Interface – eine Auswahl von vier oder mehr Bildern, die sich durch typische Merkmale und mitunter sogar Bildmotive auszeichnen. So entstand das folgende Bildbeispiel durch Eingabe des Prompts „in the style of Caravaggio“. Es weist – bei aller noch für viele Bild-KI-Modelle typischen Verzerrung von Gesichtern – doch wiedererkennbar typische Merkmale der Malerei des Künstlers auf.

Man ist versucht sich zu fragen, ob es sich nicht doch um einen verzerrten Detailausschnitt eines seiner Bilder handeln könnte. Gerade in dieser Differenz zwischen dem KI-generierten Bild und dem Werk des jeweiligen Künstlers oder der Künstlerin liegt der Anstoß für Bewegungen des Suchens, Recherchierens und Lernens im vergleichenden Sehen.

Für eine weiterführende Untersuchung der Bildkonzepte könnte man ein KI-generiertes Bild wiederum in bildbasierte Bildersuchen einspeisen. Die Suchergebnisse könnten Ausgangspunkte für weitere Suchbewegungen und Recherchen sein. Eine solche Bildersuche (wie beispielsweise Google Lens) ist nämlich meist in der Lage, visuelle Übereinstimmungen des KI-generierte Bildes mit den Werken der jeweiligen Künstlerin oder des Künstlers zu identifizieren – überraschenderweise auch dann, wenn diese sich hinsichtlich des Motivs vom KI-Bild unterscheiden. Ein Vergleich mit als ähnlich identifizierten Bildern kann als Reibungsfläche und Fragenstarter genutzt werden: Was macht die Ähnlichkeit aus? Woran machen wir die Zuschreibung einer künstlerischen Arbeit zu einer Person, einer Epoche oder einer Stilrichtung fest? Sind es die Bildmotive? Ist es die Farbigkeit? Das Licht? Die Komposition? Inwiefern unterscheiden sich hier die Ergebnisse verschiedener KI-Modelle?

Welche Qualitäten einer künstlerischen Arbeit werden in den Trainingsdaten der KI vielleicht nicht zugänglich (z.B. andere Sinneseindrücke neben dem zweidimensional Visuellen wie Materialität und Raum)?

Fachlich gesehen, würde ein derartiger forschender Blick auf KI im Kunstunterricht insbesondere die Kompetenzen Beschreiben und Analysieren fördern, da der detaillierte Blick geschult und KI-gestützte Analyseverfahren erlernt werden. Die Lernenden nehmen auftauchende Bildmotive, Bildelemente Kompositionen, Formsprache, Farbigkeit, Lichtsituation etc. vergleichend wahr und identifizieren und beschreiben Gemeinsamkeiten.

Auch Irritationen können zu Forschungsfragen führen. Solche Fragen richten sich dabei nicht nur in Richtung der Kunst sondern auch in Richtung der Beschaffenheit von KI-Modellen und den zugehörigen Trainingsdaten. Bei manchen Künstlerinnen und Künstlern ist der Stil im Modell so eng mit bestimmten Bildmotiven verknüpft, dass diese unabhängig von im Prompt festgelegten Inhalten auftauchen. Beispielsweise ist es (zum Zeitpunkt der Veröffentlichung dieses Texts) sehr schwierig mit dem KI-Modell Stable Diffusion ein Bild im Stil des japanischen Künstlers Hokusai zu erzeugen, das keine Wellen enthält.

 

Das Experiment mit dem Prompt „print of an orange in the style of Hokusai“ oder auch „a car in the style of Hokusai“ zeigt, dass der berühmte Farbholzschnitt Große Welle vor Kanagawa (1830-1832), offenbar in den Trainingsdaten so eng mit dem Künstler Hokusai verbunden war, dass sogar die Orange und das Auto mit einer Wellenform kombiniert werden. (Genutzt wurde hier der frei und kostenlos zugängliche Playground von Stable Diffusion, Stand von April und Mai 2023.)

 

Ähnlich verhält es sich mit anderen Künstlerinnen und Künstlern, deren Bilder häufig in dekorativen Kontexten Verwendung finden. Von dieser Erkenntnis aus könnte sich die Beschäftigung mit dem künstlerischen Werk auch in Untersuchungen von Populär-und Alltagskultur und nicht zuletzt Fragen von Kanonisierung und kulturellem Bildgedächtnis weiterbewegen: Welche Bilder von welchen Künstlerinnen und Künstlern sind besonders in den KI-Ergebnissen wiedererkennbar? Woran könnte das liegen? Bei welchen Künstlerinnen und Künstlern ergeben sich gar keine Ähnlichkeiten zwischen KI-Bildern und Werk?

Zurück