Im Chat mit der größten potenziellen Technologie? Begegnungen mit KI im Jahr 2022
Bilder, die von DALL-E2 auf den Prompt "How would an AI in the year 2022 look like in the style of 1930s technology visions?" hin generiert wurden.
Auch wenn 2022 ganz andere Themen im Vordergrund standen, wurde das Jahr aus Sicht der Technikfolgenabschätzung (TA) durch das Thema Künstliche Intelligenz (KI) geradezu eingerahmt: So erschien fast auf den Tag genau vor einem Jahr ein Schwerpunkt der Zeitschrift für Technikfolgenabschätzung in Theorie und Praxis (TATuP) zum Thema "KI‑Systeme gestalten und erfahren". Ziel war es u.a., den "teilweise unreflektierten Erwartungen an KI" und den "überzogenen Befürchtungen vor ihrem breiten Einsatz" mit einer prospektiven Technikfolgenabschätzung zu begegnen. Die Entwickler/innen von KI-Systemen gaben derweil dem Hype neue Nahrung: Im Juli 2022 hatte sich eine Anwendung des maschinellen Lernens durch fast alle bekannten Proteinsequenzen hindurchgefaltet und so deren räumliche Struktur näherungsweise geschätzt, was die Erforschung von Krankheiten und deren Bekämpfung erheblich erleichtern kann. Im Dezember verwies eine KI den Homo ludens – 25 Jahre nach entsprechendem Erfolg im Schach – auch beim Strategiespiel Stratego in die Schranken. Weltweite Aufmerksamkeit erregte aber insbesondere die Ende des Jahres vorgestellte Demoversion eines neuen Sprachmodells, ChatGPT. Die Eloquenz ihrer Konversation verblüffte die Öffentlichkeit, innerhalb von Tagen registrierten sich mehr als eine Million Nutzer/innen, um den Dienst auszuprobieren, und mancher wähnte sich bereits in dem "Jahr, in dem die KI-Revolution ihren Anfang nahm".
Am Anfang die Neugier
Ein Computerprogramm, das Kolumnen, Essays oder auch Gedichte über die Chancen und Gefahren von Technologien, Reden für den Landtag von Baden-Württemberg, Weihnachtspredigten und Backrezepte liefern kann und in kürzester Zeit den Turing-Test besteht – ein solches Programm macht neugierig. Doch den vielen Berichten über erfolgreiche oder auch katastrophale Chatverläufe möchte ich nicht noch einen weiteren hinzuzufügen, auch für umfassendere Untersuchungen von KI aus einer TA-Perspektive verweise ich auf die aktuell laufenden bzw. abgeschlossenen Studien des TAB und anderer. Der Blick soll nicht auf das gerichtet werden, was die KI präsentiert, sondern darauf, wie und von wem sie präsentiert wird. Und dies gewissermaßen im Spiegel der Kunst, am Beispiel einer Begegnung mit CHOM5KY, einem mit etwas älteren Sprachmodellen betriebenen System auf Basis von Noam Chomskys Schriften, das – eingebettet in eine VR-Umgebung – als Mixed-Reality-Installation von der Künstlerin und Wissenschaftlerin Sandra Rodriguez erstellt wurde.
Mediale Form der Präsentation
Während KI-Systeme häufig aufgrund ihrer Intransparenz und Komplexität wenig zugänglich sind, kommt bei CHOM5KY noch die raumzeitliche Bindung hinzu: Als Teil der Berlin Science Week war die KI Teil einer immersiven Installation, die im Berliner KINDL – Zentrum für zeitgenössische Kunst gute zwei Wochen lang als Weltpremiere im November zu sehen war. Fürs Erleben der KI musste jeweils eine Gruppe von Menschen zur gleichen Zeit zusammenkommen und sich in dem Raum VR-Brillen aufsetzen, über die die Interaktion mittels Sprache, Bild und Gesten ablief. Auch der Preis von 24 Euro für einen 40-minütigen Durchlauf schränkte die Zugänglichkeit des Werks ein. Dabei dürften die Einnahmen keineswegs ausreichen, um die Produktionskosten der Performance einzuspielen, denn neben der Technik stand ein ganzes Team von Helfenden für die Betreuung der Besuchenden bereit.
ChatGPT kommt schlichter daher, es besteht im Wesentlichen aus einem Eingabefeld für Text auf einer Website, auch die Antworten erfolgen in Textform. Die KI ist derzeit umsonst und rund um die Uhr nutzbar (solange die Server nicht vom Ansturm überfordert sind), allerdings ist eine Registrierung nötig. Das Sammeln von Daten fängt noch früher an: Noch vor der Registrierung ist das Lösen einer Captcha-Aufgabe nötig, bei der zu einem Begriff die passenden Bilder herausgesucht werden müssen – damit sollen nicht nur andere Computersysteme von der Nutzung der KI ausgeschlossen, sondern auch die Bilderkennung von KI-Systemen verfeinert werden. Außerdem werden die obligatorisch anzugebende E-Mail-Adresse und Telefonnummer jeweils verifiziert, bevor der eigentliche Chat beginnen kann.
Die KI in (Inter-)Aktion
Die Interaktion mit CHOM5KY ist insbesondere visuell beeindruckend. Die KI türmt ganze Klötzchenwelten in einer als Wüstenlandschaft präsentierten 3D-Welt aufeinander, die den Datenbestand veranschaulichen sollen, auf dem das System beruht.
Auch die Reaktionen vor allem auf mündliche, aber auch auf durch Gesten ausgedrückte Eingaben erfolgt erstaunlich souverän, was die Qualität des Sprachverstehens und der Antworten angeht. Lediglich eine leichte Verzögerung sorgt für Irritation und macht bewusst, dass hier ein Computersystem kommuniziert; gelegentliches Miss- oder Falschverstehen kann zum Abbruch von Interaktionsketten führen. Besonderen Reiz gewinnt CHOM5KY zum einen durch die Konzentration auf das Werk Noam Chomskys, das zu einer Reflexion über Sprache und Intelligenz geradezu einlädt. Zum anderen werden die Nutzer/innen durch die künstlerische Rahmung und die stellenweisen filmischen Szenen durch den Ablauf der Interaktion gelenkt, so dass man immer wieder zwischen einer aktiven Auseinandersetzung mit der KI und einer stärker reflektierenden Betrachtung wechselt. Der vielleicht bemerkenswerteste Moment der Installation ist, wenn sich die KI zurückzieht und das Feld eröffnet für die Interaktion der Betrachter/innen untereinander, die sich innerhalb des virtuellen Raums begegnen und angeregt werden, gemeinsam und spielerisch ein Kooperationsproblem zu lösen.
ChatGPT dagegen überlässt die Strukturierung der Interaktion ganz den Benutzenden. In der Fähigkeit, auf alle möglichen Anfragen zu reagieren, liegt die besondere Stärke und das Eindrucksvolle des Systems. Der sprachliche Ausdruck ist dabei eloquent, die KI beherrscht mehrere Sprachen und kann offensichtlich Konversationsverläufe über mehrere Runden hinweg verfolgen. Während die Verarbeitungsgeschwindigkeit der menschlichen Kommunikation entspricht, sorgen immer wieder gestelzte, phrasenhafte Formulierungen für Irritation. Kann dies noch als besonderer Stil des sich bewusst nüchtern (und im Übrigen auch transparent als KI) gebenden Systems durchgehen, lassen manche Antworten regelrechte Abgründe erblicken, die durch die geschliffenen Umgangsformen nur überdeckt werden. So macht das System relativ oft faktisch falsche Aussagen, die selbst bei unbekannten Themen auffallen, weil sie mitunter unmittelbar vorausgehenden Antworten widersprechen. Auf solche Fehler hingewiesen, entschuldigt sich das System pflichtschuldig, kann aber den Eindruck eines im Grunde unzuverlässigen Gesprächspartners nicht kompensieren. Auch die – zugegebenermaßen bewusst provozierten – Hinweise auf rassistische und sexistische Voreingenommenheit machen deutlich, dass klassische Probleme eines Modells, das auf der Grundlage einer zwar sehr großen, aber doch einer Auswahl von menschlichen Texten basiert, bei ChatGPT noch nicht gelöst sind.
Einbettung der KI-Anwendungen
Aufgrund solcher Schwächen richtet sich der Blick schnell auf die Ersteller/innen der Systeme. Im Fall von CHOM5KY ist das Unperfekte geradezu Programm. Das Kunstwerk soll dazu einladen "Mythen, Hoffnungen und Versprechen rund um KI zu entlarven". Es setzt die KI in Szene, um sie als Technologie ins Bewusstsein zu rufen und auch im Alltag, etwa in Smartphone-Apps, in Navigationssystemen oder bei Smart-Home-Anwendungen, erkennbar zu machen. Das Motto dabei ist "Systeme schaffen, um Systeme zu entlarven" – durchaus vergleichbar mit dem kritischen (im Sinn von aufklärerischen) Impetus von TA-Untersuchungen. Auffällig ist, dass für die Erstellung des Kunstwerks ein interdisziplinäres Team zusammenarbeiten musste und das System, ausgehend von einem bereits 2020 beim Sundance New Frontier Festival vorgestellten Prototypen, über Jahre und mit finanzieller Unterstützung des National Film Board of Canada und des Medienboard Berlin-Brandenburg weiterentwickelt wurde. Die Kunst muss offenbar einigen Aufwand betreiben, um auf Augenhöhe mit der komplexen Technik zu sein.
ChatGPT dagegen macht den Eindruck, langfristig kommerziell ausgerichtet zu sein. Das Unternehmen OpenAI hat bereits eine Reihe von KI-Anwendungen entwickelt, darunter auch DALL-E, mit dem sich Bilder auf Basis von textlichen Vorgaben erstellen lassen. Die Forschung von OpenAI soll nach Angaben des Unternehmens dazu dienen, KI sicher und an den Interessen der Menschheit ausgerichtet zu entwickeln. Dem entsprechen die bewusst und mit einigem Aufwand in die Anwendung eingebauten Sicherungsmechanismen gegen missbräuchliche Anwendungen – Vorgängermodelle wurden u.a. aus Furcht vor der Verbreitung von Falschinformationen nicht in Gänze öffentlich zugänglich gemacht. Deutlich wird in jedem Fall, dass die Veröffentlichung Teil eines Lernprogramms ist, in dem sich die KI durch das Feedback der Nutzenden stetig verbessern soll: "Jede Anfrage, die wir Spielkinder an das System stellen, hilft OpenAI beim Optimieren des Modells, bevor die Bezahlschranke heruntergeht."
Bleibende Eindrücke
Die Begegnung mit einer KI im Rahmen einer Konversation hat bei mir bleibende Eindrücke hinterlassen. Im Fall von CHOM5KY sind diese durch das sinnliche Erleben der ortsspezifischen Installation noch stärker, auch wenn diese nur kurzzeitig und episodisch war. Die Erfahrung der Fähigkeiten eines solchen Systems gewissermaßen am eigenen Leib erlaubt eine viel konkretere Auseinandersetzung mit Fragen der Implikationen von KI als die abstrakte Beschäftigung anhand von Szenarien. Insofern ist die große Aufmerksamkeit, die KI-Systemen derzeit zukommt, durchaus zu begrüßen, es wäre aber wünschenswert, wenn die Möglichkeiten, sich mit ihnen auseinanderzusetzen, niedrigschwelliger und zugänglicher für alle Menschen wären.
Es zeigt sich, dass ein Rahmen und eine gewisse Intensität der Auseinandersetzung nötig sind, um die Leistungsfähigkeit und Grenzen von KI einschätzen zu können. Wenn Reibungspunkte, wie etwa ein Bezug zu bekannten Fakten oder die Konfrontation mit anderen Perspektiven, fehlen, kann man sich in der Interaktion von der mittlerweile erreichten sprachlichen Gewandtheit der Systeme leicht blenden lassen. Auch umfassendere Fragen, wie etwa nach der Angemessenheit der hohen Energiekosten für das Training solch umfangreicher Sprachmodelle, kommen nur mit dem nötigen Abstand zu konkreten Anwendungen in den Blick. Die künstlerische Auseinandersetzung mit Technologie kann dabei ebenso für die nötige Rahmung und Reibung sorgen wie die multiplen Perspektiven einer Technikfolgenabschätzung. Auf diese Weise kann auch überzogenen Erwartungen begegnet werden, die die KI-Entwicklung schon mehrfach von einer Phase des Hypes in einen "KI-Winter" gebracht haben.
Die KI selbst gibt sich dabei üblicherweise transparent und unschuldig. Die Erwartung, einen Jahresrückblick für 2022 in einem Satz zu liefern, muss sie allerdings enttäuschen. Aber sie hat eine plausible und auch von vornherein transparent kommunizierte Erklärung: Die Datenbasis, auf der das Modell trainiert wurde, reicht nur bis 2021. Zumindest eine "akkurate Beschreibung" ist ihr auf dieser Basis nicht möglich.
This article reflects the opinion of the authors and not necessarily nor exclusively the opinion of TAB. For more information about the content of these articles and associated projects for the German Bundestag, please contact the authors or wiko∂tab-beim-bundestag.de. |