KI-Bildgeneratoren und die daraus entstandenen Bilder sind derzeit in aller Munde – und haben dabei so ihre Tücken. Als ich in dem von uns häufig genutzten Grafik-Programm Canva entdeckte, dass man im dortigen Dream Lab KI generierte Bilder erstellen kann, habe ich das direkt einmal ausprobiert. Ich habe einen Prompt geschrieben, in dem ich alle Kolleginnen genau beschrieben habe, dazu unsere drei Bürohunde und den Hinweis, dass wir alle zusammen vor einem Weihnachtsbaum stehen. Folgende Vorschläge hat mir das Dream Lab dann produziert:
Das Problem an den Bildern: Die Personen auf den Bildern – und auch die Hunde – sehen überhaupt nicht nach uns aus. Darüber hinaus stimmt nicht einmal die Anzahl der Hunde und auch die Zahl der Personen variiert. Außerdem sehen alle Personen sehr ähnlich aus – auf der Comic-Variante würde ich sogar behaupten, dass das achtmal dieselbe Person ist.
Es ist also sofort zu erkennen, dass dies KI generierte Bilder sind. Es ist aber nicht immer der Fall, dass dies so leicht festzustellen ist. Daher haben wir euch zusammengetragen, anhand welcher Kriterien man KI generierte Bilder erkennen kann. Trotz dieser Hinweise wird es immer schwieriger, diese Art von Bildern zuverlässig zu erkennen – insbesondere, da die Technologie sich schnell weiterentwickelt.
Prompts bei KI-Bildgeneratoren
Doch wie erstellt man selbst solche Bilder und was ist dabei zu beachten?
Es gibt verschiedene Möglichkeiten, aus Textbeschreibungen (sogenannten Prompts) realistische oder künstlerische Bilder zu erstellen. Die Algorithmen nutzen dabei große Mengen an Bilddaten, um neue, einzigartige Bilder zu generieren. Dabei ist es wichtig, das gewünschte Bild so genau wie möglich zu beschreiben, damit der KI-Bildgenerator ein gutes Bild erzeugen kann. Wichtig ist hier zu verstehen, dass die Bildgeneratoren keine bereits erzeugten Bilder anpassen können. Möchte man an dem Bild etwas ändern, muss man dies selbst in einem Bildbearbeitungstool tun, denn die KI wird ein ganz neues Bild erzeugen. Darüber hinaus können KI-Bildgeneratoren Bilder in verschiedenen Kunststilen erzeugen, z. B. realistisch, impressionistisch, Cartoon, Cyberpunk oder Ölgemälde. Auch dies muss man in seinem Prompt angeben.
Außerdem ist es wichtig, dass KI allgemein schlecht auf Negierungen bzw. Verneinungen reagiert. Moderne KI-Modelle sind schon deutlich besser darin geworden, Negationen im Kontext zu verstehen, besonders wenn sie auf große Datenmengen trainiert wurden. Es ist also nicht mehr so ein großes Problem wie früher, aber in komplexen Fällen kann es trotzdem noch zu Missverständnissen kommen. Daher sollte ein Prompt immer positiv formuliert sein, z.B. statt „Schreibe einen Text über die Vorteile, kein Auto zu besitzen.“ sollte man lieber „Schreibe einen Text über die Vorteile eines autofreien Lebensstils.“ formulieren.
Eine weitere Möglichkeit besteht darin, bereits vorhandene Bilder mit KI zu bearbeiten. Beim Inpainting werden Bildbereiche ergänzt oder ersetzt, z. B. das Entfernen von Objekten oder das Hinzufügen neuer Elemente. Beim Outpainting werden bestehende Bilder über ihre ursprünglichen Ränder hinaus erweitert. So kann man beispielsweise Hintergründe hinzufügen oder das Bild insgesamt erweitern und an den Rändern neue Elemente hinzufügen.
Ich habe spaßeshalber eines unserer Weihnachtsfotos durch Inpainting und Outpainting bearbeitet und anhand dieses Bildes kann man sehr gut die Kriterien überprüfen, anhand derer man ein KI generiertes Bild erkennt: Die einzelnen Elemente passen nicht zueinander, Größenverhältnisse stimmen nicht und so manch bearbeitete Hand wirkt gruselig.
Aber es gibt noch weitere Möglichkeiten, wie bzw. wofür KI generierte Bilder erstellt werden. Zum Beispiel für Fotorealistische Porträts und Avatare, denn KI kann Gesichter generieren, die aussehen wie echte Menschen – obwohl diese Personen nicht existieren. Diese Technik wird z. B. für Profilbilder, Avatare oder digitale Kunstprojekte genutzt. Bei der sogenannten Image-to-Image-Methode kann man eigene Kunstwerke erstellen, in dem mehrere Bilder kombiniert werden. Eines oder mehrere bestehende Bilder können als Grundlage dienen und durch KI in einen neuen Stil oder eine andere Version umgewandelt werden. So können beispielsweise echte Fotos in ein Gemälde umgewandelt werden.
Falls ihr euch schon einmal über unscharfe Bilder geärgert habt, sind vielleicht KI-Bildgeneratoren eine Lösung. Durch die Hochskalierung und Verbesserung von Bildern kann KI unscharfe oder niedrig aufgelöste Bilder in eine hochauflösende Version umwandeln. Das ist ideal für die Restauration alter Fotos oder das Hochskalieren von Bildern für den Druck.
Einige KI-Modelle können aus 2D-Bildern bewegliche Charaktere oder 3D-Modelle erzeugen. Dies findet dann in Filmen, Games und Virtual Reality seine Anwendung. Aber auch zur reinen Inspiration kann KI genutzt werden: Designer: innen, Künstler: innen und Werbetreibende nutzen KI zur schnellen Ideenfindung und zur Visualisierung von Konzepten. Das ist besonders hilfreich für Moodboards, Storyboards oder Marketingkampagnen.
Die Möglichkeiten von KI-Bildgeneratoren erweitern sich ständig – die Qualität und Kontrolle über die generierten Bilder wird immer besser.
Glossar
Ein KI-Bildgenerator ist eine Software, die künstliche Intelligenz nutzt, um Bilder zu erstellen. Der Generator kann auf Basis von Textbeschreibungen (also „Prompts“) Bilder erzeugen, die zu diesen Beschreibungen passen. Dabei verwendet die KI Algorithmen, die auf einer riesigen Menge von Daten trainiert wurden, um die Bildinhalte zu verstehen und darauf basierend neue, einzigartige Bilder zu erstellen.
Ein „Prompt“ ist im Grunde eine Eingabe, die du einem KI-Modell gibst, um eine bestimmte Antwort oder Reaktion zu erhalten. Es kann eine Frage, eine Anweisung oder eine Beschreibung sein, die der KI hilft, die gewünschte Information oder Antwort zu liefern.
Zum Beispiel: Wenn du ein Bild von einer bestimmten Szene erstellen möchtest, gibst du einen „Prompt“, der genau beschreibt, was du dir vorstellst. Je detaillierter der Prompt, desto gezielter und präziser kann die KI reagieren.
Es kann sich also um alles Mögliche handeln: eine Frage („Wie wird das Wetter heute?“), eine Bitte um eine Erklärung („Erkläre mir, wie Fotosynthese funktioniert“), oder eine kreative Anweisung („Erstelle ein Bild eines Waldes im Nebel“).
Rechtliche Aspekte bei der Nutzung von KI-Bildgeneratoren
Doch egal, für welchen Zweck man KI generierte Bild nutzen möchte, ist es wichtig, die rechtliche Lage zu beachten. Die ist derzeit noch unklar und entwickelt sich stetig weiter. Aber folgende Punkte solltet ihr beachten:
- Urheberrecht: Da KI-generierte Bilder ohne direkte menschliche Schöpfung entstehen, ist unklar, ob sie dem Urheberrecht unterliegen. Aktuell genießen rein KI-basierte Inhalte keinen urheberrechtlichen Schutz, da es an der menschlichen Schöpfungshöhe fehlt. Mehr dazu beim bmj.de.
- Nutzungsrechte: Es ist wichtig, zu prüfen, welche Nutzungsrechte für die mit KI erstellten Bilder gelten. Einige KI-Modelle können Nutzungsbeschränkungen haben, die zu beachten sind. Die Nutzungsrechte finden sich in der Regel immer in den Nutzungsbedingen der jeweiligen Plattform. Hier findet hier eine gute Übersicht: domenig.law
- Persönlichkeitsrechte: Wenn KI-Bilder Personen darstellen, die realen Personen ähneln oder diese darstellen, können Persönlichkeitsrechte verletzt werden. Hier ist besondere Vorsicht geboten und im Zweifel sollte man sich juristischen Rat einholen.
Bedacht werden muss immer, dass der Einsatz von KI in dieser Form noch recht jung ist und deswegen hier nur der aktuelle Stand abgebildet werden. Darüber hinaus ist es ein sehr komplexes Thema, das nicht allein durch ChatGPT oder Midjourney abgedeckt ist. Wir bleiben aber dran und werden daher das weite Feld der Künstlichen Intelligenz hier auf unserem Blog immer mal wieder behandeln. Stay tuned! 😊