KI-Roboter besiegt mehrere Pokerprofis
Zum ersten Mal in der Geschichte ist es Forschern gelungen, eine künstliche Intelligenz (KI) zu entwickeln, die Poker spielt und es gleich mit mehreren Gegnern auf einmal aufnehmen kann. Das KI-Programm trägt den Namen „Pluribus“, hat 13 der weltbesten Pokerspieler der Welt besiegt, davon fünf auf einmal. Zudem beherrscht es sogar die Kunst des Bluffs. Wissenschaftler sprechen von einem weiteren „Meilenstein“ der KI-Forschung, Kritiker sorgen sich hingegen um die Zukunft des Spiels. Hier die wichtigsten Infos.
Pluribus gewinnt „1.000 Dollar pro Stunde“
Eine neuentwickelte KI namens Pluribus versetzt zurzeit die Pokerwelt in Aufregung. Dem System ist es gelungen, dauerhaft gegen 13 namhafte Pokerprofis zu gewinnen, darunter auch der Schweizer Linus Löliger, der in der Szene als vielleicht bester Online Pokerspieler der Welt gilt. Um das Programm auf die Probe zu stellen wurden insgesamt 10.000 Hände in zwölf Tagen gespielt. Am Ende der Testphase trat die KI sogar gegen fünf Profis auf einmal an. Auch in diesem Fall spielte die KI besser und gewann. Schlussendlich hatte Pluribus das 480-fache seine Einsatzes rausgeholt. Gespielt wurde die bekannte Pokervariante „No Limit Texas Hold’em“.
„Wenn es echtes Geld gewesen wäre, hätte Pluribus etwa 1.000 Dollar pro Stunde verdient“, so das Fazit der beiden Wissenschaftler Noam Brown und Tumas Sandholm , die das neue System entwickelten und erstmals Anfang Juli im US-amerikanischen Fachmagazin Science vorstellten. „Unser Roboter hat gegen die besten Pokerspieler der Menschheit gewonnen“, lautete hier das Kredo. Die Meldung sorgt seitdem weltweit für Furore. Forscher sprechen von einer „Sensation“ und einem weiteren „Meilenstein“ der KI-Forschung. Doch was genau macht die Pokermaschine so spektakulär?
KIs auf dem Vormarsch
Dass KIs dank lernfähiger Algorithmen und neuronaler Vernetzungen inzwischen selbst hochkomplexe Strategiespiele beherrschen und sich auf diesem Feld auch gegen Menschen durchsetzen können, ist nichts Neues. Siegreich waren die Maschinen bereits im Schach, im asiatischen Spiel Go sowie in der japanischen Schachvariante Shogi. Auf allen drei Feldern wurden menschliche Weltklasse-Spieler von der KI geschlagen . Bekanntheit erreichte an dieser Stelle vor allem das KI-System AlphaGoZero, welches ganz ohne menschliche Unterstützung in nur drei Tagen Profiniveau erreichte.
Die Spiele haben allerdings eine gemeinsame Komponente: Egal, ob beim Schach, Go oder Shogi, die Spielsituation und -position des Gegners ist für alle Spieler permanent ersichtlich . Die Forschung spricht daher von „Spielen mit perfekter Information“. Dies ist jedoch nicht bei einem Kartenspiel wie Poker der Fall, wo man das Blatt seines Gegners überhaupt nicht kennt oder allerhöchstens erahnen kann. Die Entwicklung einer Spielstrategie wird durch diesen Sachverhalt stark erschwert.
Jetzt scheinen die Computer jedoch auch diese Hürde genommen zu haben. Die Forscher Brown und Sandholm verweisen an dieser Stelle darauf, dass Pluribus zudem auch die Schwierigkeit überwunden hat, einen Strategieplan gegen mehr als einen Gegner zu entwickeln. Im Wortlaut heißt es dazu:
“Bisher waren KI-Meilensteine im strategischen Denken immer nur auf Zwei-Parteien-Wettbewerbe begrenzt. Ein Spiel mit fünf oder sechs Mitspielern zu absolvieren erfordert fundamentale Veränderungen darin, wie die KI ihre Spielstrategie entwickelt. Denn sie muss dann deutlich variablere Strategien einsetzen. Während des Spiels optimiert Pluribus seine Strategie, indem er in Echtzeit nach einer besseren Lösung für die aktuelle Spielsituation sucht.”
Wie die beiden Wissenschaftler weiter erklären, hat Pluribus in diesem Punkt bereits eine eigene Problemlösungsstrategie entwickelt: Das Programm spielt demnach vorerst wiederholt gegen Kopien seines eigenen Selbst , wodurch es sich kontinuierlich verbessert. Basierend auf seinen Erfahrungen entwickelt die KI folglich eine sogenannte „Strategie-Blaupause“, ein vorab ermitteltes Spielspektrum, das es dem System ermöglicht, ein Pokerspiel gegen fünf bis sechs Gegner gleichzeitig zu absolvieren – und zu gewinnen. „Pluribus größte Stärke ist seine Fähigkeit, Strategien zu mischen“, so das Statement der Forscher.
Laut aktuellen Berichten der Tageszeitung Zeit beherrscht die KI inzwischen sogar die hohe Kunst des Bluffs. Die Fähigkeit wird auch von Pokerprofi Jason Les bestätigt, der gegen Pluribus gespielt hat. „Er ist ein Monsterbluffer“, so der Kommentar. Die beiden Entwickler erklären diesbezüglich:
“Wenn ein Spieler immer nur dann den Einsatz erhöhen würde, wenn er das bestmögliche Blatt hat, wüssten seine Gegner, dass sie in dem Fall immer passen müssten. Die KI umgeht dies, indem sie bei jeder Entscheidung die Wahrscheinlichkeit des Spielzugs ungeachtet ihres Blatts mitberücksichtigt. Dadurch kann sie erkennen, wann es auch bei einem schlechten Blatt vorteilhafter ist, einen Einsatz zu machen – sie blufft.”
Praktischer Nutzen?
Laut Brown und Sandholm ergibt sich ein hoher praktischer Nutzen aus dem neuen KI-System. Die Fähigkeit, fünf Gegner in einem so komplexen Spiel wie Poker zu schlagen , eröffne demnach „ganz neue Möglichkeiten, KIs für Probleme in der realen Welt einzusetzen“. Denn auch dort sei es nötig mit „verdeckten Informationen“ zu arbeiten, außerdem seien „oft mehrere Akteure“ an bestimmten Situationen beteiligt.
Von anderen KI-Forschern wird das System allerdings auch kritisiert: „Ein Mensch der sehr gut Poker spielen kann, ist ja auch nicht gleich ein Börsengenie“, heißt es zum Beispiel vonseiten Kristian Kerstings, Wissenschaftler an der TU Darmstadt. Generell fallen die Reaktionen auf die neue KI unterschiedlich aus. Kritiker befürchten gar das Ende des Online Pokers. Die Betreiber seien künftig dazu gezwungen, viel Geld zum Schutz ihres Geschäfts einzusetzen. Die Spieler könnten sonst über kurz oder lang nicht mehr wirklich wissen, wer mit ihnen am Tisch sitzt.
Die Bedenken scheinen berechtigt. Die Entwicklungen bleiben jedoch vorerst abzuwarten. Im Übrigen ist das Thema KI im Glücksspielsektor ohnehin immer präsenter: Erst Ende April gab der US-amerikanische Casinogigant Caesars Entertainment bekannt, in der Sache gemeinsam mit der UNLV (University Las Vegas) zu forschen. Angestrebt wird die Etablierung eines neuen Technologiezentrums.