Timothy Schneider, Bachelor Geschichte
Habt ihr das neue Lied Now And Then von den Beatles gehört? Anfang November wurde es veröffentlicht und mit der Hilfe von künstlicher Intelligenz haben die verbliebenen Beatles-Mitglieder John Lennons Stimme das neue Lied singen lassen. Generell ist KI ein Thema, welches in letzter Zeit immer wieder diskutiert wird. Vor fast einem Jahr hat ChatGPT uns alle überrascht. Aber auch in der bildenden Kunst gab es eine Revolution. Vor allem durch sogenannte text-to-image Programme, wo man mit einer Textaufforderung eingeben kann, was man gerne sehen will und dieses Bild dann generiert wird.
Doch so populär diese KI-Zeichenprogramme wie Stable Diffusion und Midjourney auch sind, gibt es einen grossen Widerstand von viele bildenden Künstler_innen. Viele konventionelle Künstler_innen sind dieser Technologie gegenüber skeptisch eingestellt. Es gibt mit künstlicher Intelligenz viele Möglichkeiten für Menschen, sich mit einigen Mausklicks als KI-Künstler zu verkaufen. Zu viele Sachen sind rund um die Benutzung dieser Programme noch ungeklärt.
Das Problem mit Copyright
Künstliche Intelligenz braucht Trainingsdaten. Das sind Daten, in diesem Fall Bilder, welche analysiert werden und mit denen das KI-Programm lernt, wie bestimmte Sachen aussehen sollen. Beispielsweise kann KI ein Bild von einem Menschen, der im Auto sitzt, und ein Bild von einem am Schreibtisch sitzenden Menschen gezeigt werden. Diese beiden Bilder sind entsprechend beschrieben. So weiss das Programm, dass beide Bilder einen sitzenden Menschen beinhalten. Es erkennt, was ähnlich ist und schliesst dann daraus, dass diese bestimmte Form wohl «ein sitzender Mensch» ist. Damit wurde das Programm trainiert zu erkennen, wie ein sitzender Mensch aussieht. Wenn wir das Programm jetzt anweisen, ein Bild eines sitzenden Menschen zu erstellen, dann kann es dieses mühelos produzieren. Mit diesem Prinzip kann ein Programm fast alles lernen, solange es genügend Trainingsdaten erhält.
Aber woher kommen all diese Bilder, mit der das KI-Programm trainiert wird? Diese werden mittels Webscraping gesammelt. Kurz gesagt heisst das, dass aus unterschiedlichsten Internetquellen eine riesige Masse an Bildern heruntergeladen werden. Viele Bilder sind aber urheberrechtlich geschützt. Die Tatsache, dass sie im Internet frei zugänglich sind, heisst aber nicht, dass sie frei benutzbar sind. Das heisst, dass viele Bilder ohne Einverständnis der Künstler_innen gesammelt werden.
Künstliche Intelligenz lernt Diskriminierung
Künstliche Intelligenz basiert also auf Daten, die in unserer Welt produziert werden. Das heisst aber auch, dass die Fehler unserer Welt in diese Daten reproduziert sind, und das Programm diese Fehler mitlernt. Das ist eine Diskussion, die man auch schon aus anderen Anwendungen von Künstliche Intelligenz kennt. Zum Beispiel bei Gesichtserkennungssoftware. Ein bekanntes Problem in diesem Bereich ist, dass viele Gesichtserkennungssoftware-Programme Schwierigkeiten haben, schwarze Gesichter zu unterscheiden. KI-Kunst hat auch rassistische Annahmen. Wenn es eine Person darstellen muss, tendiert es dazu, vor allem weisse Menschen zu zeichnen.
Wer macht Kunst?
Dann stellt sich noch die Frage, ob wir etwas, was ein Computer herstellt, überhaupt Kunst nennen wollen. Wenn nicht, ist Now And Then dann auch keine Musik? Kunst besitzt eine emotionale Dimension. KI kann momentan noch keine Emotionen spüren. Aber ist das eine faire Kritik? Ein Bleistift oder ein Pinsel kann das auch nicht. Es sind schlicht die Werkzeuge, mit der einer Künstler_in etwas erschafft. Das Gleiche könnte man über KI sagen. Die Textaufforderungen, mit denen man das Programm füttert, werden ja schliesslich durch eine Person geschrieben. Eine Person mit Intentionen und Emotionen.
Trotzdem ist es nicht ganz dasselbe. Der Bleistift macht genau die Striche, die durch deine Muskeln dirigiert werden. Die KI interpretiert deinen Text anhand eines Algorithmus. Und dieser Algorithmus ist sehr intransparent. Man weiss also nicht genau, ob die Intention, die man im Text geschrieben hat, auch so vom Algorithmus aufgefasst wird. Das erzeugte Bild mag also eine andere Intention beziehungsweise emotionale Perspektive haben wie der Verfasser des Textes. Das heisst, die Bestimmung der Botschaft des Bildes liegt nicht nur beim Erfasser_in, aber auch beim Algorithmus, beziehungsweise. beim Unternehmen dahinter.
Vielleicht interpretiert die Software aber keine Emotionen oder Intentionen. Das macht es leider nicht besser. Denn so würden Emotion und Intention verloren gehen und KI-Bilder komplett emotionslos sein. Es gibt keine Form von Abneigung, welche die unterschiedlichen Textverfasser_innen voneinander unterscheidet. Das Unternehmen dahinter ist jetzt die einzig relevante Entscheidungsträger.
Ignorieren wir das aber schnell, und gehen davon aus, dass die Bilder unser eigenes Produkt sind. Auch hier gilt aber: Ist das Schreiben einer ausgeklügelten Textaufforderung eine Kunst? Ist das scharfsinnige Formulieren eines Textes schlicht die neue Evolution in der bildenden Kunst nach dem digitalen Zeichnen? Wo ist hier das Handwerk? Ein Grossteil, ich will sogar sagen, dass der größte Teil, der Arbeit durch die KI gemacht wird. Einzelne Details sind dank der erwähnten Intransparenz schwierig zu korrigieren. Man kann die Textaufforderung ein wenig ändern, aber man weiss nie genau, wie diese Änderungen dargestellt werden. Künstler_innen sind auch hier also abhängig von den Arbeitsmechanismen der KI. Viel abhängiger als von einem Bleistift.
Sind diese Argumente aber nicht etwas mit Vorurteilen behaftet? Heisst das wirklich, dass KI keine Kunst machen kann, oder ist eine bessere Folgerung, dass KI momentan noch etwas Schwierigkeiten hat mit Kunst? Wird das mit einer Verbesserung der Technologie nicht alles behoben werden? Im Falle der diskriminierenden Quellenbasis vielleicht schon. Wenn wir eine egalitäre Ausgangslage haben, werden auch die Resultate dies reflektieren. Sowohl das Copyrightproblem sowie die Problematik der algorithmischen Intransparenz bedürfen aber ein Umdenken, wie Künstliche Intelligenz in diesem Bereich angewendet werden sollten.
Zum Glück gibt es die Beatles
Das Lied der Beatles dient womöglich als Beispiel dafür, wie KI in anderen Kunstformen benutzt werden kann. Das Lied wurde von der Gruppe vollkommen selber zusammengestellt. Selber geschrieben, selber komponiert; Künstliche Intelligenz war hier nur ein Werkzeug, um ihre Vision zu erfüllen. Wenn jemand ein Anrecht hat, John Lennons Stimme zu benutzen, sind es wohl die Beatles. Es sind aber immer noch sie, die eine artistische Vision haben und dies umsetzen.
Anstelle eines text-to-image Prozesses kann der Fokus auf andere KI Anwendungen gelegt werden, die statt das menschlich-artistische Handwerk zu ersetzen, diese unterstützen. Photoshop hat beispielsweise eine auf KI basierende Funktion, die sagt, wo man im Bild am besten eine Schattierung anbringen soll. Das Kunstwerk ist so von einem Künstler erstellt, und zwar nicht nur in ein paar Sätzen, sondern mit tausend Pinselstrichen.