Ein erster Einblick in die Spieltheorie – Vom Anschauen zum Handeln

27. April 2011 von Josef Honerkamp in Ansichten

Die Physik hat die Kunst, der Natur durch kluge Experimente ihre Gesetzmäßigkeiten zu entlocken, früh kultiviert und im Laufe ihrer Geschichte  immer mehr zur Perfektion gebracht. Sie hat dabei unser heutiges Weltbild entscheidend geprägt und wird dieses auch weiterhin beeinflussen. So sehr dieses Vorgehen Erfolg hatte, so hat der in Alltag stehende Mensch doch immer das Gefühl, dass dieses sich entwickelnde realistische Weltbild zwar eine große Bereicherung darstellt, dass es aber im täglichen Leben mehr zu tun gibt als „anschauen“ oder beobachten und analysieren. In vielen Situationen muss er sich entscheiden, er muss handeln, er muss sogar eine Strategie entwickeln, wenn er konsistent und überlegt handeln will. Er muss Systeme steuern. Das wird allgemein als Kunst angesehen, entzogen dem Zugriff mathematischen Denkens. So spricht man von der Kunst des Steuermanns, des Staatenlenkers, und Büchern übers Management kann man wohl kaum eine Nähe zum präzisen oder mathematischen Denken vorwerfen.

Nun möchte man einwenden, dass das Regeln von Systemen doch schon ganz gut von unseren Ingenieuren beherrscht wird. Welche technischen Geräte kennen wir nicht alle, in  denen etwas geregelt wird und automatisch eingestellt wird. Ob es die Belichtung beim Fotoapparat, die Temperatur in einem Gebäude oder der Füllstand eines Behälters ist,  immer wird ein Wert gemessen und somit ein sogenannter Ist-Wert festgestellt. Dieser wird mit einem Soll-Wert verglichen, und eine Differenz bewirkt eine entsprechende Einwirkung auf das System zur Verringerung der Differenz. Das ist ein Prinzip, das immer und immer wieder verwendet wird.

Das richtige Reagieren auf Verhältnisse der Umwelt ist noch die leichteste Übung, wenn  man zu handeln hat. Schwierig wird es erst richtig, wenn das Gegenüber, auf das man reagieren muss, ebenso ein handelnder Mensch ist. Dann können die Folgen meines Handels ganz erheblich davon abhängen, wie der andere Mensch sich dabei verhält und das ist in der Regel unberechenbar. Schon als Kind lernen wir, mit einer solchen Situation spielerisch umzugehen, und auch wir  Erwachsene, die solche Situationen im Ernstfall des Lebens kennen, finden solche Situationen auf der eher harmlosen Ebene der Gesellschaftsspiele von großem Reiz. Die Begeisterung vieler für das  Fußball- oder Schachspiel lebt zum großen Teil von der Unvorhersagbarkeit der Spielzüge und deren Folgen und gerade solche Spiele sind auch das erste Anschauungs- und Übungsmaterial, wenn man die Prozesse handelnder Personen analysieren will und darin Gesetzmäßigkeiten feststellen will. Deshalb hat auch der gesamte Zweig der Mathematik, der sich mit solchen Prozessen beschäftigt, in denen zwei oder mehr Akteure oder "Agenten" beteiligt sind, den Namen Spieltheorie bekommen. Deren Ergebnisse sind natürlich nicht nur für das Auffinden bester Strategien bei Gesellschaftsspielen von Interesse. In der Ökonomie z.B. spricht man auch von Spielern oder  "Playern", sogar "global Playern", die sich auf dem Markt tummeln. Somit ist verständlich, dass die Spieltheorie gerade auch in der Makroökonomie eine große Rolle spielt.

Eine kurze Geschichte der Spieltheorie
Spieltheorie als eine mathematische Disziplin wurde im Jahre 1944 von dem Mathematiker John von Neumann und dem Ökonomen Oskar Morgenstern begründet. In ihrem Buch ‘The Theory of Games and Economic Behavior’ fassten sie viele Untersuchungen zusammen, die John von Neumann in den Jahren 1920-1940 über alle möglichen Spiele wie Poker usw. angestellt hatte, und diskutierten, wie die Ergebnisse ihrer Untersuchungen auf Ökonomie, Soziologie und Politik angewandt werden könnten. Unter der Annahme, dass sich die Spieler absolut rational verhalten, konnte von Neumann einige rigorose Theoreme für sogenannte Nullsummenspiele für zwei Personen beweisen. Weitere Meilensteine sind die Arbeiten des amerikanischen Mathematikers John Forbes Nash, der Aussagen über allgemeinere Spiele formulieren konnte, und mit dem heute der Begriff des Nash-Gleichgewichtes verbunden ist. Seit den späten 70er Jahren kann man sagen, dass die Spieltheorie die nützlichsten und wichtigsten Methoden für die Analyse von Situationen bereitstellt, in denen rationale Agenten Entscheidungen treffen müssen, wobei die möglichen Entscheidungen der anderen ins Kalkül zu ziehen sind. Im Jahre 1994  erhielten J. F. Nash und  Reinhard Selten (Universität Bonn) sowie John C. Harsanyi den Nobelpreis für Wirtschaftswissenschaften für ‘their pioneering analysis of equilibria in the theory of non-cooperative games".

Die Auszahlungsmatrix
Wie in jeder Wissenschaftssparte gibt es auch in der Spieltheorie einige wichtige einfache Beispiele, an denen man vor jeder systematischen Beschäftigung mit dem Gebiet schon erkennen kann, worum es im Prinzip geht und welche Konzepte in dem Feld eine tragende Rolle spielen. Von einem solchen Beispiel will ich hier berichten.
Jeder Spieler braucht für seine Entscheidung, welche der möglichen Handlungen er in der gegebenen Situation denn nun ausführen soll, einen Maßstab, d.h. eine Bewertung der Folgen der jeweiligen Handlung. Einen solchen Maßstab kann man konstruieren, indem man jeder Handlung eine Belohnung zuordnet.  Die Auszahlungsmatrix fasst die Belohnungen für jeden Spieler in Abhängigkeit seiner gewählten Handlung und der Handlungen der anderen Agenten zusammen.
Um ein Beispiel zu geben, betrachten wir ein Spiel mit zwei Spielern, bei dem jeder bei einer Entscheidung für eine Handlung zwei Möglichkeiten hat und bei dem die beiden Spieler jeweils unabhängig, ohne Kenntnis der Entscheidung des anderen, ihre Entscheidung fällen müssen. In meinem Beitrag "Der freie Wille eines Agenten"  habe ein solches Spiel schon erwähnt: Zwei Spieler haben jeweils eine schwarze und eine weiße Kugel in der Hand und müssen zur gleichen Zeit eine von diesen auf den Tisch legen. Sind dann die Farben der Kugeln auf dem Tisch gleich, so hat Spieler A gewonnen, sonst B. Belohnt man das Gewinnen mit einem Punkt, das Verlieren demgemäß mit einem Minuspunkt, so kann man die Belohnung bzw. Auszahlung für Spieler A in Form einer Matrix darstellen: 

 B legt weiß auf den TischB legt schwarz auf den Tisch
A legt weiß auf den Tisch 1-1
A legt schwarz auf den Tisch-1 1

wobei die Belohnungen von Spieler B rot markiert sind.

Solch eine Auszahlungsmatrix kann für jedes Paar von Entscheidungen der beiden Spieler angegeben werden, aber auch für den Ausgang eines Spieles, in dem viele verschiedene Handlungen möglich sind. Wenn, wie in diesem Falle, der Gewinn des einen Spielers genau der Verlust des anderen ist, die Summe der einzelnen Einträge in jeder Spalte also Null ist, dann spricht man von einem Nullsummenspiel.

Das Gefangenendilemma
Nullsummenspiele sind gut überschaubar, deshalb sind auch die meisten Gesellschaftsspiele wie Schach, Tennis, usw. Nullsummenspiele. Was der eine gewinnt, verliert der andere. Im Leben gibt es aber nicht nur Nullsummenspiele, es gibt eher Nichtnullsummenspiele, wie z.B. ein solches, das folgende Handlungen und Belohnungen enthält:
 

 B kooperiertB kooperiert nicht
A kooperiert3, 30, 5
A kooperiert nicht5, 0 1, 1

Jeder der beiden Spieler hat sich hier unabhängig von dem Verhalten des anderen zu entscheiden, ob er in einer Sache mit dem anderen kooperiert oder nicht kooperiert (was manchmal auch "defektieren" genannt wird). Wenn also nun beide Spieler ‘kooperieren’, erhalten sie beide die Auszahlung ‘3’. Sie profitieren also mehr, als wenn sie beide nicht kooperieren, denn dann würden sie nur jeweils die Auszahlung ‘1’ erhalten. Die Werte der Zahlen sind dabei nicht bedeutsam, wichtig ist nur, dass 1 < 3 ist, so dass sich kooperieren also lohnt. Das entspricht unserer Alltagserfahrung. Wenn nun aber einer zur Kooperation bereit ist, der andere aber nicht kooperieren will, so sei die Auszahlung für den Kooperationswilligen ‘0’, für den Nichtkooperierenden ‘5’: Auch das kennen wir aus dem Leben: Der gute Wille wird manchmal ausgenutzt oder - Gier macht rücksichtslos. Die genauen Zahlenwerte sind wieder nicht so entscheidend, nur dass 0<1 und 5>3 ist, d.h. die Auszahlung für den Nichtkooperierenden größer ist, als wenn er kooperiert, der Kooperationswillige dann aber schlechter dran ist, als wenn er auch nicht kooperiert hätte.

Es ist klar, wie das Spiel verläuft, Spieler A überlegt: Falls ich kooperiere, ist meine Auszahlung 3 oder 0, je nachdem, wofür sich der andere entscheidet. Kooperiere ich aber nicht, so ist meine Auszahlung 5 bzw. 1, als in jedem Fall höher, was immer auch der andere tut. Also kooperiere ich nicht. Der zweite Spieler kommt mit den gleichen Argumenten zum selben Schluss. Also kooperieren beide nicht und erhalten jeweils die Auszahlung 1. Dabei hätten sie doch beide die viel größere Auszahlung 3 erhalten können, wenn sie kooperiert hätten. Wenn aber jeder (oder auch nur einer)  nur an seinen eigenen Vorteil denkt - und damit im naiven Sinne rational handelt, ergibt sich eine Situation, die für beide nicht optimal ist.
Das Spiel mit einer solchen Auszahlungsmatrix hat den Namen "Gefangenendilemma" erhalten. Das Dilemma besteht darin, dass die Lösung (d.h. die Handlungsweisen der beiden), die von außen gesehen für beide Spieler die beste ist, von den rational überlegenden Spielern nicht erkannt werden kann. Und um diese Situation, die wir auch in dieser Abstraktion schon als lebensnah empfinden, etwas zu konkretisieren, hat man eine Geschichte dazu erfunden, in der die Spieler zwei Gefangene sind, die gemeinsam einen Autodiebstahl und einen Mord begangen haben. Den Diebstahl kann man ihnen nachweisen, den Mord nicht. Auf den Diebstahl bekommen sie jeder ein Jahr Gefängnis. Nun wird beiden von der Polizei ein Angebot gemacht. Gesteht jemand den gemeinsamen Mord, so kommt er frei und der andere erhält wegen des Mordes drei Jahre Gefängnis. Wenn allerdings der andere auch gesteht, bekommen beide zwei Jahre Gefängnis. Man sieht: Kooperation von beiden heißt hier: Beide halten dicht. Dann ist die Auszahlung: Nur ein Jahr Gefängnis, besser als wenn beide ‘singen’, das gibt zwei Jahre Gefängnis. ‘Singen’ bzw. gestehen bedeutet nicht kooperieren. Hält einer dicht, gesteht aber der andere, so hat er das Nachsehen, er erhält drei Jahre Gefängnis, während der Nicht-Kooperierende, d.h. Gestehende den Vorteil genießt. Man kann dieses Handlungsschema natürlich auch auf viele andere Situationen übertragen, ich finde solche Geschichten dazu aber eher verwirrend.

Die Evolution der Kooperation
Kooperation stellt sich also zunächst nicht ein, kann sich bei "rational" agierenden Spielern gar nicht einstellen. Nun ist das bei den Gefangenen nicht so wesentlich, aber in den gesellschaftlich bedeutsamen Fällen, insbesondere unter Staaten und in vielen Gemeinwesen ist Kooperation erwünscht. Wie kann sich Kooperation entwickeln - auch unter rein rational agierenden Personen?

Aufgrund unserer Lebenserfahrung wissen wir, dass Kooperation Vertrauen erfordert. Dieses aber schenkt oder erwirbt man erst, wenn man mit dem anderen eine Situationen öfter durchlebt und daraus Erwartungen für sein Verhalten aufbaut. So liegt es nahe, das so genannte iterierte Gefangenendilemma zu studieren, bei dem zwei Spieler immer wieder vor der Situation des Gefangendilemmas gestellt werden: Kooperieren oder nicht kooperieren. Die Auszahlungsmatrix ist stets die gleiche, jeder Spieler handelt, mehr oder bewusst, nach einer Strategie, z.B. "immer kooperieren", "immer nicht kooperieren", "mal so, mal so", "immer nur kooperieren, wenn der andere es auch getan hat". Es ergibt sich so ein Wettstreit der Strategien, man kann nach z.B. 200 Iterationen nachschauen, welche Strategie gegenüber einer anderen jeweils im Vorteil ist, und so versuchen, eine Rangfolge aufzustellen.

Man könnte noch die Belohnung mit einer Art Fitness im Rahmen einer Gesellschaft von Agenten in Beziehung setzen und dann eine Evolution simulieren und beobachten, wie einige Strategien aussterben, andere dominant werden, und man könnte vielleicht auch noch die Möglichkeit von Strategiewechseln einbauen. So etwas ist alles geschehen, und zwar schon vor etwa 20 Jahren. Der US-amerikanische Politikwissenschaftler Robert Axelrod hat in seinem Buch "Die Evolution der Kooperation" solche Überlegungen ausführlich dargestellt. Dieses hat auf mich vor etwa zehn Jahren, als ich mich mit der Spieltheorie ein wenig beschäftigte, großen Eindruck gemacht. Es wäre interessant zu erfahren, welchen Einfluss dieser Ansatz auf die professionelle Forschung in diesem Gebiet gehabt hat und noch heute hat. Lesenswert ist das Buch heute noch allemal.


4 Kommentare zu “Ein erster Einblick in die Spieltheorie – Vom Anschauen zum Handeln”

  1. jmg Antworten | Permalink

    Spieltheorie

    Ihre Ausführungen zur Spieltheorie haben mich an folgendes beeindruckende Video zum Thema Kooperation erinnert.
    http://www.youtube.com/watch?v=p3Uos2fzIJ0
    (Youtube Video: Golden Balls - £100,000 Split Or Steal? 14/03/08 )

    Diese Webseite erklärt den Inhalt der Show und die verschiedenen Spielphasen
    http://en.wikipedia.org/wiki/Golden_Balls

    Und hier das zugehörige Paper zur Show (einer der Autoren ist Richard Thaler,
    ein bekannter und nobelpreisverdächtiger Behavioral Economist). Verhaltensökonomen stellen die in der Spieltheorie benutzte Rationalitätsannahme grundsätzlich in Frage.

    Nebenbei bemerkt: Ihr David Axelrod heisst eigentlich Robert. David Axelrod war der Wahlkampfmanager von Barack Obama. Er hat im Januar 2011 seinen Posten im Weissen Haus aufgegeben. Vielleicht hat er das
    im nächsten Jahr anstehende "Spiel" schon als aussichtslos verloren gegeben. Hoffentlich haben Sie beim Video schauen genau so viel Vergnügen, wie ich beim Lesen ihres Blogs.

  2. Josef Honerkamp Antworten | Permalink

    @jmg

    Vielen Dank für die interessanten Links und für den Hinweis auf den falschen Vornamen (das werde ich gleich berichtigen). Den Link zum Paper kann ich aber nicht erkennen. Ich vermute, dass sich daraus noch schneller die wesentliche Botschaft ermitteln lässt.

  3. Balanus Antworten | Permalink

    Link zum Paper

    Vielleicht meinte @jmg dieses Paper:

    Post, Thierry, Martijn J. van den Assem, Guido Baltussen, and Richard H. Thaler. 2008.
    "Deal or No Deal? Decision Making under Risk in a Large-Payoff Game Show."
    American Economic Review, 98(1): 38–71.

    DOI:10.1257/aer.98.1.38

    http://www.aeaweb.org/...p?doi=10.1257/aer.98.1.38

Einen Kommentar schreiben


3 − drei =