KI und die Vergangenheit: Bilder, die wir 2023 gerne gehabt hätten
Für einige Artikel fehlte es uns in diesem Jahr an Bildmaterial. Unter anderem, weil es sich um Themen aus längst vergangener Zeit handelte. Wäre KI die Lösung gewesen?
Dieses Bild hat die KI-Künstlerin Mary-Ann Weber für uns erstellt. Es soll Schmucktrends aus der Merowinger-Zeit darstellen. Als Basis dienten Ergebnisse einer Ausgrabung bei Bonn.
Die Süddeutsche Zeitung veröffentlichte vergangenen Sommer einen Artikel über Künstliche Intelligenz (KI) und Fotografie. Die Frage: Kann man das Bild eines Philippinenadlers mit KI so gut kreieren, dass es als „eine potenzielle Doppelseite bei National Geographic“ gedruckt werden könnte? Zum Vergleich dienten die Fotos des Fotografen und Biologen Klaus Nigge, den es viel Zeit und Schweiß gekostet hatte, die seltenen Greifvögel tatsächlich vor die Linse zu bekommen. Vier Wochen lang saß er auf einem Baum.
Das Fazit des Artikels war ein klares „Noch nicht“.
Wir haben uns für diesen Text eine andere Frage gestellt: Kann KI uns dabei unterstützen, die Grenzen der Fotografie zu überwinden? Heißt: Kann KI Bilder generieren, die kein Mensch je hätte fotografieren können, selbst nicht nach vier Jahren auf einem Baum – weil die Ereignisse in ferner Vergangenheit liegen?
KI und die Grenzen der Fotografie
National Geographic zeigt in diesem Artikel ebensolche Bilder: ein Mann mit Handprothese aus dem Mittelalter, Wikinger, die im Jahr 845 Hamburg angriffen, Neandertaler bei der Zubereitung ihrer Speisen.
Kameras gab es damals nicht. KI macht fotoähnliche Bilder trotzdem möglich, in Minutenschnelle und ganz ohne Illustrator*innen. Wir haben KI-Künstler*innen und -expert*innen um Hilfe gebeten. Wie realistisch sehen die Resultate aus? Und welche Fehler unterlaufen den Generatoren?
„Fotos“ von Neandertalern
Den Anfang macht die Urzeit: Neandertaler bereiteten ihre Speisen nach Rezept zu – das fanden Forschende der Liverpool University in England Ende 2022 heraus (zum Artikel). Wie es ausgesehen haben könnte, wenn unsere fernen Verwandten Körner in Tierhäuten aufweichten, haben wir Arman Mkrtchyan, KI-Künstler aus Armenien, gefragt.
KI lässt diesen Neandertaler fast aussehen wie fotografiert.
Das Foto eines Neandertalers kann es nicht geben. KI lässt diesen jedoch relativ echt wirken.
Auf seinem Instagram-Account Ai.Timetraveler präsentiert er eine vielseitige Sammlung historischer Szenen, von der Steinzeit bis zum Ersten Weltkrieg, generiert mit Hilfe des KI-Bildgenerators Midjourney. Dieser ist, Stand heute, der, der die realistischsten Bilder von Menschen erstellt. In ein Programm wird eine Beschreibung eingetippt, nach kürzester Zeit erhält man vier Vorschläge. Oftmals ist es nur bei genauestem Hinsehen erkennbar, dass es sich nicht um eine echte Fotografie handelt.
Erstaunlich bei Arman Mkrtchyans Bildern der Neandertaler ist, wie echt Fell und Haare wirken. Allerdings lässt die Haut der Hände die Person eher wie eine Wachsfigur wirken. Mkrtchyan nutzt Midjourney seit rund einem Jahr und teilt die Ergebnisse auf Social Media. In den vergangenen Jahren hat er viel an Film- und Fotosets gearbeitet. „Mit meinen historischen Bildern möchte ich den Menschen Dinge zeigen, die mit der Kamera nicht festzuhalten sind“, sagt er.
König Hinz, zum Leben erweckt
Ein Zeitsprung in die Bronzezeit. Im brandenburgischen Seddin soll vor fast 3.000 Jahren ein sagenumwobener König regiert haben. Bestattet wurde „König Hinz“ mit goldenem Schmuck und einem Schatz – soweit die Legende. Vergangenen Herbst wurden nahe des Grabs die Überreste eines weiteren monumentalen Bau ausgegraben (zum Artikel): ein riesiger Hallenkomplex, der entweder dem Herrscher oder seinem Vorgänger gehört haben könnte.
König Hinz, wie Stable Diffusion ihn für KI-Experte Michael Förtsch erschaffen hat.
In einer anderen Variante trägt "König Hinz" eine Krone, die Halle ist mit Schnitzereien geschmückt.
Der Journalist und KI-Experte Michael Förtsch hat mit Hilfe von Stable Diffusion Bilder dazu kreiert. Förtsch beschäftigt sich seit Jahren intensiv mit dem Thema KI und hat sogar eine eigene Version von Stable Diffusion programmiert. Das Text-to-Image-Modell ging im Sommer 2022 ans Netz und ist Open Source, heißt: „Jeder kann es herunterladen und mit eigenen Bildern tunen, alles ist erlaubt“, erklärt Förtsch. Beteiligt an der Entwicklung des Prototyps der KI war unter anderem die Ludwig-Maximilians-Universität in München.
Förtsch hat seine Version von Stable Diffusion mit mehr als 2.000 Bildern von Kinofilmen trainiert, um diesen Look zu generieren – und so sehen die Bilder auch etwas nach Game of Thrones aus.
Ein detailreiches Bild, bei dem sogar die Fingernägel echt wirken. Die Prothese könnte jedoch auch als eiserner Handschuh interpretiert werden. Bilder von Midjourney werden zunächst immer im Quadrat generiert.
Unsere ersten eigenen Versuche, das Bild eines Mannes aus dem Mittelalter mit Handprothese zu erstellen, waren nicht unbedingt zufriedenstellend. Aber immerhin lustig.
Der Mann mit der künstlichen Hand
Weiter geht es im Mittelalter: In Bayern haben Archäolog*innen vergangenen Herbst ein spannendes Skelett aus dem 15. Jahrhundert gefunden – ausgestattet mit einer Hand-Prothese (zum Artikel). Wie diese Prothese ausgesehen haben könnte, hat der Berliner Fotograf und KI-Künstler Hannes Caspar für uns ermittelt. Bekannt geworden ist der 44-Jährige unter anderem durch seine Fotografien von Schauspieler*innen und Künstler*innen.
Aktuell gewinnt er jedoch vor allem mit künstlich generierten Bildern Fans: „Es ist irre, was im Bereich KI auf Instagram abgeht“, sagt er. Im Sommer legte er unter dem Pseudonym @caspar.jade ein Profil an, auf dem er von ihm generierte Bilder teilt. Rund 20.000 Menschen folgen ihm bereits, täglich kommen Hunderte dazu. „Mein KI-Account ist aktuell sehr viel erfolgreicher im Wachstum als mein alter Account.“
Caspars Bild der mittelalterlichen Prothese hätte vor ein paar Monaten vielleicht noch anders ausgesehen. „Hände stellen, genau wie gebeugte Beine oder Arme, bis heute eine Herausforderung dar für die meisten KI-Bildgeneratoren, auch für Midjourney“, sagt Caspar. „Teilweise sieht das sehr ungesund aus.“ Die Ergebnisse sind über die vergangenen Monate jedoch immer besser geworden – angeblich sollen die Macher von Midjourney dafür Tausende Bilder von Händen eingespeist haben, heißt es unter Expert*innen.
Eine weitere Eigenheit von Midjourney ist auch, dass die Menschen immer aussehen wie Models, sagt Caspar. „Wenn man einen ganz normalen Menschen zeigen will, muss man Begriffe wie ‚creepy‘, ‚ugly‘ oder ‚weird‘ eingeben.“
Der Schmuck der Merowingerinnen
Wie „schön“ Midjourney die Welt sieht, kann man auch bei den Ergebnissen der Berliner KI-Künstlerin Mary-Ann Weber sehen. Eigentlich arbeitet die 41-Jährige als freiberufliche Fotografin mit Fokus auf Werbefotografie. Seit Februar dieses Jahres beschäftigt sie sich jedoch auch mit KI-Tools und hat mit ihren Arbeiten schon mehrere Wettbewerbe gewonnen.
Auf ihrem Instagram-Account @Lolaroux.ai zeigt sie Bilder, die in Fantasiewelten führen. Für uns hat sie mithilfe von Midjourney Bilder von Frauen aus dem Mittelalter erstellt (siehe auch das Titelbild dieser Geschichte). Ein Team aus Archäolog*innen und Restaurator*innen hatte in Bonn-Beuel ein Frauengrab aus der Merowingerzeit freigelegt und die Ergebnisse der Forschung im Juni präsentiert. Die prachtvollen Grabbeigaben gewährten Einblicke in die Schmuck- und Kleidungsvorlieben aus der Merowingerzeit (zum Artikel).
Auffallend schön – aber wirklich "zeitgemäß"? Diese Frau soll aus der Merowingerzeit sein. Wer historische Bilder künstlich erzeugen will, muss den Generator mit vielen Informationen füttern.
So schön die Frauen auf den Bildern wirken, historisch korrekt sind die Darstellungen weniger. Angefangen bei den roten Bändern im Haar der Frau bis hin zur Menge des Schmuckes. Man muss die KI also extrem explizit mit Informationen füttern. Wie Menschen in bestimmten Epochen gekleidet waren, wissen die Generatoren (noch) nicht unbedingt.
Wikinger in Hamburg
Ein anderes Problem sieht man auf dem Bild, das Hannes Caspar zu einem geschichtlichen Ereignis in Hamburg im Jahr 845 erstellt hat: Man darf nicht davon ausgehen, dass KI weiß, wie die Welt zur Zeit der Wikinger, Römer oder Griechen aussah. Die Bilder sollen einen Angriff dänischer Krieger auf die Hammaburg zeigen. Im Sommer verfassten wir einen Artikel über das geschichtliche Ereignis (zum Artikel). Es gab einige Illustrationen, aber richtig glücklich war die Redaktion mit den Bildern nicht.
Die Männer auf den Bildern von Caspar wirken sehr real. Doch der Hintergrund verrät die KI. Hamburg war 845 eine kleine Siedlung mit Holzbauten – und die ersten Fensterscheiben wurden erst um das Jahr 1000 angefertigt.
Der Angriff der Wikinger auf Hamburg könnte so ausgesehen haben: Aufzeichnungen zufolge sollen die damalige Hammaburg niedergebrannt haben.
Die Wikinger sehen beeindruckend aus. Nur der Hintergrund ist für das Jahr 845 nicht realistisch - Hamburg war damals eine kleine Siedlung aus Holözbauten.
Auch Michael Förtsch hat sich dem Wikingerangriff auf Hamburg angenommen. Tatsächlich umringte die Hammaburg damals ein Holzzaun ähnlicher Optik. Erstellt hat er auch dieses Bild mit Stable Diffusion.
Römer mit DALL-E
Doch es gibt nicht nur Midjourney und Stable Diffusion, sondern zahlreiche weitere Alternativen. Zum Beispiel DALL-E. Hier ähnelt die Ästhetik eher Computerspielen oder Illustrationen, Menschen wirken nicht so realistisch wie bei Midjourney. DALL-E gehört zum gleichen Unternehmen wie ChatGPT und war einer der ersten modernen Bildgeneratoren mit Künstlicher Intelligenz überhaupt. Hier lassen sich Bilder im Dialog weiterentwickeln mit Befehlen wie „ändere die Haarfarbe in blond“.
Schon die Römer hatten Schoßhunde, verkündeten im Sommer Forschende aus England in einer Studie (zum Artikel). Das hätten wir gerne gesehen. Hier zeigt Michael Förtsch ein Ergebnis, das DALL-E zum Thema ausspuckt.
Ein eigener Versuch der Redaktion. Trotz mehrerer Versuche kam kein wirklicher „Schoßhund" bei Midjourney heraus.
Risiken und Nebenwirkungen von KI
Bereits im Jahr 2026 könnten 90 Prozent der Bilder im Internet künstlich erstellt worden sein, heißt es in einer Studie von Europol, die vor den Folgen der KI warnt. Was KI kann, ist beeindruckend, aber mindestens so gefährlich – vor allem in Bezug auf Fake-News. „Wir sehen das im Internet immer mehr, ob Szenen vom Krieg in Gaza oder in der Ukraine oder vom Parteitag der Grünen: Täglich gibt es auf TikTok und anderen Plattformen Bilder von Szenen, die so nie stattgefunden haben“, sagt Michael Förtsch. Beim genaueren Hinschauen erkenne man zwar, dass etwas nicht stimmt. „Aber so genau schauen eben nicht alle hin.“
Auch für die KI selbst könnte die Menge an künstlich generierten Bildern am Ende schädlich sein. Wissenschaftler*innen der Stanford University und der Rice University haben in einer Studie herausgefunden, dass KIs, die mit KI-generierten Daten gefüttert werden, irgendwann nicht mehr funktionieren. „Sie entwickeln eine Art KI-Krankheit, eine sogenannte Model Autophagy Disorder“, sagt Förtsch. „Die Augen sind plötzlich verzerrt, die Struktur der Haut komisch.“
Sicher ist: KI funktioniert nur, weil Tausende Fotograf*innen und Illustrator*innen echte Bilder geschaffen haben. Aber wie es Hannes Caspar im Gespräch auf den Punkt brachte: „KI ist kein kurzzeitiger Trend wie die App Clubhouse, die während Corona kurz gehypt wurde und dann wieder verschwand. KI wird bleiben – und erstmal immer besser werden.“ Die Ergebnisse, die wir in diesem Artikel erzielt haben, könnten schon in einem halben Jahr noch besser aussehen. Caspar: „Irgendwann wird jeder seinen eigenen Kinofilm generieren können, wenn er denn will - das ist doch toll.“ Klingt nach Spaß auf der einen – und nach ordentlich Energiebedarf auf der anderen Seite. Der ist bei KI nämlich hoch: Schon 2027 könnte KI so viel Strom benötigen wie die kompletten Niederlande, prognostiziert ein Forscher von der Vrije Universiteit Amsterdam.
Kann KI die Vergangenheit fotorealistisch darstellen? In diesem KI-generierten Bild zeigt Arman Mkrtchyan Queen Victoria mit Gemahl Prince Albert bei der Whisky-Verköstigung: In einem Schloss in Schottland wurde 2023 der älteste Whisky der Welt entdeckt (zum Artikel). Im 19. Jahrhundert pflegte Queen Victoria eine enge Freundschaft zur Beisitzerin, der 6. Duchess of Atholl. Die Haushaltsbücher dieser Zeit offenbaren, dass die Queen den Scotch Whisky des Hauses probiert hatte.