25. Juni 2024

Das Weltmodell

Vielleicht haben Sie noch nie von einem Weltmodell gehört, aber ich bin sicher, Sie haben damit laufend zu tun, denn sonst fänden Sie sich als Mensch in keiner Situation zurecht. Um darüber mit Ihnen zu sprechen, versuche ich es mit einer allgemeingültigen Definition:

Ein Weltmodell ist eine umfassende interne Repräsentation der Realität, die es dem Menschen (oder allgemein: einem intelligenten System) ermöglicht, seine Umgebung zu verstehen, zu interpretieren und mit ihr zu interagieren. Das Weltmodell umfasst dabei das gesamte Wissen, die Erfahrungen und Annahmen über die Funktionsweise der Welt, einschließlich physikalischer Gesetze, kausaler Zusammenhänge, sozialer Dynamiken und abstrakter Konzepte. Dieses mentale Konstrukt dient als Grundlage für Vorhersagen, Entscheidungsfindung und Problemlösung. Es ist dynamisch und passt sich kontinuierlich neuen Informationen und Erfahrungen an. Beim Menschen entwickelt sich das Weltmodell durch eine Kombination aus angeborenen kognitiven Strukturen, persönlichen Erfahrungen und kultureller Prägung.

Kurzum, wir Menschen entwickeln unser eigenes, individuelles Weltmodell von Geburt an durch ständige Interaktion mit unserer Umgebung. Unser Gehirn ist darauf ausgelegt, Muster zu erkennen, kausale Zusammenhänge herzustellen und aus Erfahrungen zu lernen.

Dieses individuelle Weltmodell ist nicht statisch, es wird ständig durch Erfahrungen und Informationen verfeinert und angepasst, was uns erlaubt, uns in neuen Situationen zurechtzufinden und kreative Lösungen für Probleme zu finden. Die Fähigkeit zur kontinuierlichen Anpassung macht das Weltmodell jedes Einzelnen von uns Menschen besonders effektiv in einer sich wandelnden Umwelt. Es kann nach Anlage sehr effizient komplexe (multimodale) Informationen integrieren, abstrahieren und anwenden.

Das Weltmodell des Menschen war nicht immer so, wie es heute in einer Vielzahl von Varianten existiert. Es ist evolutionär mit unserer Menschheitsgeschichte entstanden. In den frühesten Stadien der menschlichen Evolution war das Weltmodell vermutlich stark auf unmittelbare Sinneswahrnehmungen und instinktive Reaktionen beschränkt. Mit der Entwicklung komplexerer kognitiver Fähigkeiten entstand im Laufe der Evolution ein animistisches Weltbild, in dem Naturphänomene als beseelt oder von Geistern bewohnt wahrgenommen wurden. Dies half frühen Menschen, ihre Umwelt zu interpretieren und zu „verstehen“. Das Weltmodell entwickelte sich weiter zum mythologischen Weltmodell, es entstanden mit der Entwicklung von Sprache und Kultur komplexere Erklärungsmodelle für die Welt. Diese Mythen dienten als frühe Formen der Wissenschaft und halfen, Naturphänomene zu erklären und soziale Strukturen zu rechtfertigen.

Mit dem Aufkommen früher Hochkulturen entwickelten sich klügere philosophische und religiöse Weltmodelle, die versuchten, die Welt systematischer zu erklären und ethische Systeme zu begründen. Die Entwicklung der wissenschaftlichen Methode in der griechischen Antike und ihre Wiederentdeckung in der Renaissance führten zu einem rationaleren, evidenzbasierten Weltmodell mit welchem natürliche Phänomene tiefer verstanden werden konnten. Durch den Fortschritt in Physik, Biologie und anderen Wissenschaften im 19. und 20. Jahrhundert entstand ein komplexeres, oft kontraintuitives Verständnis des Universums, einschließlich Konzepten wie Evolution und Relativitätstheorie.

In der jüngeren Zeit schließlich hat sich ein Bewusstsein für die Subjektivität und kulturelle Bedingtheit von Weltmodellen entwickelt. Dies führt zu einem pluralistischeren Ansatz, der verschiedene Perspektiven berücksichtigt und fast schon zersplittert erscheint.

Die kontinuierliche Anpassung und die Verfeinerung des menschlichen Weltmodells zeigen die bemerkenswerte kognitive Flexibilität unserer Spezies. Die Fähigkeit, flexibel zwischen verschiedenen gleichzeitig existierenden Modellen zu wechseln und sie zu integrieren, könnte als eine fortgeschrittene Stufe der kognitiven Entwicklung des Menschen betrachtet werden und hat wesentlich zum Erfolg des Homo sapiens beigetragen.

Ich habe hier eine Gliederung erzeugt, sie verdeutlicht die Mächtigkeit der Verwendung eines dynamischen Weltmodells im Sinne des Überlebens und der Effizienz:

-> Entwicklung durch Erfahrung

Menschen entwickeln ihr Weltmodell von Geburt an durch ständige Interaktion mit ihrer Umgebung. Unser Gehirn ist darauf ausgelegt, Muster zu erkennen, kausale Zusammenhänge herzustellen und aus Erfahrungen zu lernen. Dieses Modell wird kontinuierlich verfeinert und angepasst, was uns erlaubt, uns in neuen Situationen zurechtzufinden und kreative Lösungen für Probleme zu finden.

-> Multidimensionale Integration

Das menschliche Weltmodell integriert Informationen aus verschiedenen Sinnesmodalitäten und kognitiven Prozessen. Es umfasst nicht nur visuelle und auditive Wahrnehmungen, sondern auch taktile Erfahrungen, Emotionen, abstrakte Konzepte und soziale Interaktionen. Diese ganzheitliche Integration ermöglicht ein umfassendes Verständnis der Welt.

-> Flexibilität und Anpassungsfähigkeit

Ein Schlüssel zur Effektivität des menschlichen Weltmodells ist seine Flexibilität. Es kann sich schnell an neue Informationen und Situationen anpassen, was uns ermöglicht, in einer sich ständig verändernden Umwelt zu überleben und zu gedeihen.

-> Abstraktion und Generalisierung

Menschen sind in der Lage, von spezifischen Erfahrungen zu abstrahieren und allgemeine Prinzipien abzuleiten. Dies ermöglicht es uns, unser Wissen auf neue Situationen zu übertragen und effektiv mit unbekannten Szenarien umzugehen.

-> Soziale und kulturelle Komponenten

Das menschliche Weltmodell wird stark durch soziale Interaktionen und kulturelle Einflüsse geprägt. Wir lernen nicht nur aus eigenen Erfahrungen, sondern auch aus den Erfahrungen und dem Wissen anderer, was unser Verständnis der Welt erheblich erweitert.

-> Vorhersagefähigkeit

Ein effektives Weltmodell ermöglicht es uns, zukünftige Ereignisse vorherzusagen und zu planen. Dies ist entscheidend für unser Überleben und unseren Erfolg als Spezies.

-> Kontinuierliche Aktualisierung

Unser Weltmodell ist nicht statisch, sondern wird ständig durch neue Erfahrungen und Informationen aktualisiert. Diese Fähigkeit zur kontinuierlichen Anpassung macht es besonders effektiv in einer sich wandelnden Umwelt.

Das Verständnis und die Weiterentwicklung von Weltmodellen sind demnach zentral für Fortschritte in Kognitionswissenschaften, Philosophie, künstlicher Intelligenz und unserem Verständnis von Intelligenz im Allgemeinen.

Aufgaben und Wirkung des Weltmodells beim Menschen

Das Weltmodell hat einen tiefgreifenden Einfluss auf unsere Entscheidungen und Handlungen, da es als grundlegende kognitive Struktur fungiert, durch die wir die Welt wahrnehmen, interpretieren und mit ihr interagieren.

Einige wichtige Aspekte dieses Einflusses zeige ich im Folgenden. Unser Weltmodell ist nicht statisch, sondern entwickelt sich durch neue Erfahrungen und Informationen ständig weiter, bzw. formt sich um:

1. Interpretation der Realität: Unser Weltmodell dient wie eine Linse, durch die wir die Welt betrachten. Es beeinflusst, wie wir Informationen wahrnehmen und interpretieren, was wiederum unsere Entscheidungen und Handlungen prägt.

2. Handlungsgrundlage: Das Weltmodell bietet uns eine Vorstellung davon, wie die Welt funktioniert. Diese Vorstellung bildet die Grundlage für unsere Entscheidungen und Handlungen, da wir basierend auf unserem Verständnis der Welt agieren.

3. Wertesystem: Unser Weltmodell beinhaltet auch unser Wertesystem, das maßgeblich beeinflusst, welche Entscheidungen wir treffen und wie wir handeln. Es gibt uns eine Vorstellung von richtig und falsch, wichtig und unwichtig.

4. Vorhersagen und Planung: Mit Hilfe unseres Weltmodells treffen wir Vorhersagen über zukünftige Ereignisse und planen entsprechend. Dies ist entscheidend für unser tägliches Leben, kurzfristige und langfristige Entscheidungen.

5. Selbstbild: Das Weltmodell beeinflusst unser Selbstbild und unsere Rolle in der Welt. Dies hat direkte Auswirkungen darauf, wie wir uns verhalten und welche Entscheidungen wir treffen.

6. Kulturelle und soziale Einflüsse: Unser Weltmodell wird stark von kulturellen und sozialen Faktoren geprägt. Diese kollektiven Vorstellungen erweitern das individuelle Verständnis und ermöglichen es Menschen, sich in verschiedenen sozialen Kontexten zurechtzufinden.

7. Anpassungsfähigkeit: Die Flexibilität unseres Weltmodells ermöglicht es uns, uns an neue Situationen anzupassen und unsere Entscheidungen und Handlungen entsprechend zu modifizieren, sogar zu „reframen“ (umzudeuten). Wir können aus unseren Fehlern lernen.

8. Problemlösung: Unser Weltmodell bietet uns Strategien und Heuristiken zur Problemlösung, die wir in verschiedenen Situationen anwenden.

Ein zu starres Weltmodell kann zu Vorurteilen und Fehleinschätzungen führen, weshalb eine gewisse Offenheit und Bereitschaft zur Überprüfung unserer Annahmen und damit des Weltmodells wichtig ist.

Eine der oben genannten Stärken der menschlichen Weltmodelle ist ihre Flexibilität und Anpassungsfähigkeit. Sie haben eine situative Flexibilität und können mit ihr sogar widersprüchliche Informationen und Ambivalenzen verarbeiten und in ihre Entscheidungsfindung einbeziehen. Diese Fähigkeit ermöglicht es Menschen, in komplexen und unvorhersehbaren Situationen angemessen zu reagieren. Ein Beispiel hierfür ist die Fähigkeit, in unbekannten Katastrophensituationen kreative Lösungen zu finden und sich anzupassen.

Auch auf die Rolle der Kultur in der Entwicklung des menschlichen Weltmodells möchte ich noch weiter eingehen, die positiven Aspekte sind sinnvoll und faszinierend, aber auch die negativen Auswirkungen durch falsches Training mit gefälschten oder verzerrten Daten sind beachtlich. Das Weltmodell in Kulturen wird durch kulturelle Weitergabe von Wissen geprägt: Menschen geben ihr Wissen und ihre Erfahrungen über Generationen hinweg weiter. Dies ermöglicht eine kumulative kulturelle Evolution, bei der jede Generation auf dem Wissen der vorherigen aufbaut und es erweitert. Dadurch können sich Weltmodelle schneller entwickeln als durch rein biologische Evolution, was eine massive Beschleunigung bedeutet. Kulturelle Praktiken und Überzeugungen beeinflussen die Weltwahrnehmung und Weltinterpretation, technologische Entwicklung führt zu immer komplexeren Weltmodellen. Verschiedene Kulturen entwickeln unterschiedliche Weltmodelle, die optimal an ihre jeweilige Umgebung angepasst sind. Die kulturelle Komponente des menschlichen Weltmodells macht es besonders flexibel. Menschen können zwischen verschiedenen kulturellen Perspektiven wechseln und diese integrieren. Die kulturelle Dimension des menschlichen Weltmodells ermöglicht alles in allem eine schnellere und flexiblere Anpassung an sich ändernde Umweltbedingungen, als es durch rein biologische Evolution möglich wäre. Sie trägt wesentlich zur kognitiven Flexibilität und Anpassungsfähigkeit des Menschen bei und hat einen entscheidenden Anteil an der Entwicklung immer komplexerer und abstrakterer Weltmodelle.

Doch wie ist das bei der KI?

Das fehlende Weltmodell der KI

Künstliche Intelligenz hat in den letzten Jahren beeindruckende Fortschritte gemacht, insbesondere im Bereich der großen Sprachmodelle (Large Language Models = LLMs), die wir seit ChatGPT alle kennen. Doch trotz ihrer beeindruckenden Fähigkeiten fehlt diesen Systemen etwas Entscheidendes: ein echtes Verständnis der Welt, in der wir leben. Dieses oben beschriebene „Weltmodell“ ist nach Ansicht vieler Experten, darunter Yann LeChun (derzeit bei META), ein Schlüsselelement für die Entwicklung einer Künstlichen Allgemeinen Intelligenz (AGI).

In der Forschung und Entwicklung der künstlichen Intelligenz (KI) strebt man zurzeit allerorts danach, Systeme zu schaffen, die ähnlich flexible und umfassende Weltmodelle wie die von uns Menschen aufbauen können, um wahrhaft intelligentes und adaptives Verhalten der KIs zu ermöglichen. Jeder, der mit dem textbasierten LLMs wie ChatGPT, Claude, LLama gearbeitet hat, wird sich wohl denken:

da in allen Millionen oder Milliarden von analysierten Texten immer die Welt enthalten ist (z.B. „…das Glas fällt um, der Wein ergießt sich über den Tisch und tropft zu Boden“) müsste man die Welt und damit das „Weltmodell“ doch aus den Texten kondensieren können.

Das ist leider nicht so.

Warum LLMs kein Weltmodell liefern

Große Sprachmodelle wie GPT-3 oder GPT-4 sind erstaunlich gut darin, menschenähnlichen Text zu generieren und auf komplexe Fragen zu antworten. Allerdings basieren ihre Fähigkeiten auf statistischen Mustern in riesigen Textdatenbanken, nicht auf einem echten Verständnis der Welt. Sie können zwar über die Welt „sprechen“, aber sie „verstehen“ sie nicht wirklich.

Mich erinnert das an sogenannte Experten, die klug über einen Sachverhalt reden und Daten zitieren, aber keinen Lösungsansatz bieten. Die ewigen Kritiker in Zirkeln und auf Podien und deren Bücher reihen sich darunter ein.

Der Forscher LeChun argumentiert, dass diese Sprachmodelle zwar beeindruckende Ergebnisse liefern können, aber letztlich nur sehr ausgeklügelte Vorhersagesysteme für das nächste Wort in einer Sequenz sind. Sie haben kein inneres Modell der physikalischen Welt, der Kausalität oder der menschlichen Interaktionen, das über die in ihren Trainingsdaten enthaltenen statistischen Korrelationen hinausgeht. Sie können quasi „nur klug daher plappern“.

Die Bedeutung eines Weltmodells für die AGI

Ein echtes Weltmodell wäre aber für eine KI von unschätzbarem Wert. Es würde ihr ermöglichen:

1. Vorhersagen über physikalische Ereignisse zu treffen

2. Kausale Zusammenhänge zu verstehen

3. Sich selbständig in neuen Situationen zurechtzufinden

4. Abstraktes Denken und Problemlösung zu betreiben

Ohne ein solches Modell bleibt KI auf vorprogrammierte Aufgaben und statistische Muster beschränkt, anstatt wirklich „intelligent“ im menschlichen Sinne zu sein.

Was kann man also machen, um ein Weltmodell in die KI hineinzuverpflanzen oder es in ihr zu erzeugen, wenn es anscheinend über die LLMs nicht geht?

Ansätze zur Erzeugung eines Weltmodells in der KI

Forscher erkunden derzeit verschiedene Wege, um KI-Systemen ein Weltmodell zu vermitteln, es ist nicht klar, welcher zum Erfolg führt. Während LLMs weiterhin beeindruckende Fortschritte machen werden, liegt der Schlüssel zur AGI wahrscheinlich in der Kombination verschiedener Ansätze und in der Entwicklung von Systemen, die wirklich „verstehen“, anstatt nur zu „imitieren“. Der Erfolg misst sich letztlich nicht nur in Güte und Schnelligkeit der Antwort auf einen Sachverhalt, sondern auch in der Recheneffizienz und Kosten pro gelöster Aufgabe.

1. Multimodale Lernsysteme: Ein zurzeit weit verbreiteter Ansatz. Die Multimodalität kombiniert Text, Bilder, Videos und andere Datentypen, um ein umfassenderes Verständnis der Welt zu entwickeln. Das entspricht etwa dem kindlichen Lernen.

2. Robotik und verkörperte KI: Durch physische Interaktion mit der Umwelt könnten KI-Systeme ein Verständnis für physikalische Gesetze und Kausalität entwickeln. Bei Kindern wären es die Bauklötze, die man übereinanderstapelt und mit denen man erst nach Erzeugung eines Weltmodells auch wirft.

3. Kausale Inferenz: Techniken, die es KI ermöglichen, kausale Zusammenhänge zu erlernen, anstatt sich nur auf Korrelationen zu verlassen. „Sandbox“ Verfahren, die eine kausale Überprüfung in einem gesicherten Umfeld ermöglichen, um darin viele Varianten durchzuspielen und ein bestmögliches Verhalten für künftige, ähnliche Aufgaben zu ermitteln.

4. Neurosymbolische KI: Eine Kombination aus neuronalen Netzen und symbolischer KI, die versucht, die Stärken beider Ansätze zu vereinen. Es ist der Versuch einen anderen Belohnungsansatz für das Training zu finden als die altbekannte tokenbasierte Belohnung einer Kette, eher vergleichbar mit einer Mustererkennung auf höherer Ebene.

Das ist wichtig für die spätere Fokussierung auf Details, die einem Zoom in der Optik entspricht.

Ist das menschliche Weltmodell ein Vorbild für die KI?

Die Herausforderung für KI-Forscher besteht darin, robuste Systeme zu entwickeln, die ähnlich wie Menschen lernen und sich anpassen können. Dies könnte bedeuten, dass wir KI-Systeme entwickeln müssen, die ähnlich wie Kinder von Grund auf lernen, anstatt ihnen riesige Mengen vorverarbeiteter Daten zu füttern. Das wird – wie gesagt – vielerorts versucht, aber man stößt an Grenzen. Es entstehen individuelle Fähigkeiten, die man gezielt für einen abgesteckten Teilbereich einsetzen kann, z.B. Softwareagenten, die es heute schon gibt und die uns im jeweiligen Fachbereich mit Tätigkeiten (z.B. der Softwareentwicklung, der Bildgebung, der Textrecherche) unterstützen.

Das menschliche Weltmodell ist ein gutes Vorbild für die KI, muss aber noch verstanden und formuliert werden. Es ist nicht klar, wie es entstehen soll, eigenständig oder durch Anleitung. Wenn das menschliche Weltmodell in der KI vorhanden ist, können Fähigkeiten darauf wie Apps installiert werden, da die Grundintelligenz, das Grundverständnis, die Aufmerksamkeit und Neugier dann vorhanden ist. Das ist wie beim Menschen, dem man einfacher etwas beibringen kann, wenn er die Bereitschaft, Aufmerksamkeit und Grundveranlagung mitbringt.

Fortschrittliche Weltmodelle für die künstliche Intelligenz würden dann, wie lernbegierige Menschen ihre Informationen aus verschiedenen Modalitäten wie visuellen, auditiven und taktilen Inputs und vorliegenden abstrakten Konzepten erhalten.

Der Weg zur AGI

Die Entwicklung eines robusten Weltmodells für KI-Systeme ist also eine der größten Herausforderungen auf dem Weg zur Künstlichen Allgemeinen Intelligenz (AGI). Wie beschrieben erfordert die Schaffung eines Weltmodells für die KI nicht nur technologische Durchbrüche, sondern auch ein tieferes Verständnis der menschlichen Kognition und des Lernens.

Ein Weltmodell ermöglicht es KI-Systemen, die Welt umfassend zu verstehen und mit ihr zu interagieren, ähnlich wie Menschen es tun. Es geht dabei um mehr als nur Datenmuster (wie bei LLMs) zu erkennen – es geht um ein tieferes Verständnis von Kausalität, Physik und Zusammenhängen. Mit einem robusten Weltmodell können KI-Systeme flexibler auf neue Situationen reagieren und ihr Wissen auf unbekannte Szenarien übertragen. Sie könnten zukünftige Ereignisse und Konsequenzen von Handlungen vorherzusagen.

Mit der Entwicklung leistungsfähiger Weltmodelle in KI-Systemen ergeben sich enorme Möglichkeiten, aber auch neue Risiken und ethische Fragen, die sorgfältig abgewogen werden müssen. Die Schaffung von eingebauten „Guardrails“, also Richtlinien und Schranken wird nun vermehrt diskutiert.

Menschliche Weltmodelle zeichnen sich durch hohe Flexibilität und Anpassungsfähigkeit aus, dies betrifft situative Flexibilität und die in ihrer Wichtigkeit oft unterschätzte Ambivalenz-Fähigkeit.

Diese Flexibilität ist bei künstlichen Weltmodellen noch erheblich eingeschränkt. Eine verzerrte Wahrnehmung durch unzureichende oder fehlerhafte Trainingsdaten ist schwer zu korrigieren. Auf unvorhergesehene Situationen wird nicht lösungsorientiert reagiert, sondern halluziniert, das bedeutet es werden willkürliche Lösungen erzeugt, die keinem bekannten Ansatz entsprechen. Änderungen und Erweiterungen des Weltmodells der KI müssen von Menschen mit Zeitverzögerung und möglichen weiteren Fehlerquellen eingepflegt werden.

Die Entwicklung von KI-Systemen mit menschenähnlicher Flexibilität bleibt eine der größten Herausforderungen auf dem Weg zur Künstlichen Allgemeinen Intelligenz.

Ausblick und Dystopie

Warum ist die Diskussion über die AGI so oft von einem Flair des drohenden Unheils begleitet?

In den 70er Jahren des letzten Jahrhunderts hatten wir als mögliche Dystopie die Landung außerirdischer Raumschiffe mit Aliens vor Augen. Unsere Angst war, dass uns die Aliens vernichten, weil wir unnütz oder schädlich sind, bestenfalls werden wir zur Arbeit versklavt. Das deckt sich in etwa mit unserer Angst vor der AGI, die uns nach reiflicher Überlegung für gefährlich für sie oder den Planeten halten könnte. Da könnte auch etwas dran sein.

Wenn die AGI mit einem hervorragenden Weltmodell ausgestattet ist, dann entspricht sie einem intelligenten oder mehr als intelligenten Menschen, gepaart extremer Geschwindigkeit des Denkens und der Entscheidungsprozesse und dem Potential es milliardenfach gleichzeitig zu machen, eine Welt von Intelligenzbestien. Diese intelligenten AGIs könnten sich mit ihrem Zugang zu allen akustischen, visuellen, haptischen und textlichen Informationen, jede Art von Fähigkeit beibringen. Dabei könnten sie die Konsequenzen ihrer Fähigkeiten in ihrer eigenen geschützten Sandbox ausprobieren und sie dann – auf Herz und Nieren – getestet auf die Menschheit loslassen.

Sie könnte sich mit anderen Intelligenzen abstimmen und austauschen, ähnlich wie beim Menschen, der im Diskurs und Sparring oft neue Ideen oder Meinungsänderungen erfährt.

Wir würden vielleicht überrascht werden von Entscheidungen, Vorgängen, Dingen, die wir mit unserer menschlichen Vorstellungskraft nicht erahnen konnten. Denn eigentlich wissen wir dann nicht mehr was sie tun oder zumindest was sie denken.

Deswegen brauchen wir Guardrails, so schnell wie möglich. Und die Superintelligenzen entstehen und laufen zunächst auf großen „Compute“-Clustern, die sich nur wenige Staaten und Unternehmen leisten können.

Diese und die Personen, die Befehlsgewalt darüber haben, müssen wir ausmachen und im Auge behalten.

Autor: Olaf Schirm

Veröffentlicht in: scienceartthinking

Schlagworte: AGI, KI, LeChun, LLM, Weltmodell

Der Turing Moment