Google´s AlphaZero schlägt Stockfish 8, nachdem es sich in 4 Stunden Schach selbst beigebracht hatte!

stayoutoftherz (68)in #chess • 6 years ago

Liebe Steemianer,

die Schachwelt, aber auch die AI-Welt wurde im Dezember 2017 geschockt, als AlphaZero nach nur 4 Stunden Schach-Selbstlernen (nur die Spielregeln waren eingegeben worden, keinerlei Strategie!) im Stande war, in einem Wettkampf über 100 Spiele eines der weltbesten Schachprogramme, Stockfish 8 mit 64:36 hinwegzufegen (28 Siege, 72 remis, keine verloren).

Stockfish ist ein open-source Schachprogramm, das regelmäßig die Ranglisten im Computerschach anführt, derzeit in der Version 9, z.B. hier. Gegen so ein Programm zu gewinnen, sogar mit schwarz (ohne Anfangsvorteil), wie dreimal geschehen, ist keine Kleinigkeit, also wie war das möglich?

AlphaZero, entwickelt von Google-Tochter Deepmind, hat eine komplett andere Art, Schach zu lernen und zu spielen. Während bei klassischen Programmen wie Stockfish, das pro Sekunde 70 Mio. Stellungen bewertet und sich dabei auf Eröffnungsbibliotheken stützt und Gewichtungen von menschlichen Schachmeistern zur Bewertung heranzieht, wurde bei AphaZero rein auf machine learning mittels neuronalen Netzwerken gesetzt. Im Kern des Programms gibt es Gruppen von software-„Neuronen“, die zusammengeschaltet sind und ein künstliches Neuronennetz bilden. Nach jedem Zug bewertet das Netz die Stellung und die Wahrscheinlichkeit zu gewinnen. Nach jedem Spiel updatet sich das Netz, Züge die gewinnträchtig waren, werden bestätigt, die anderen verworfen, auch sich selbst-bestätigendes lernen („self-reinforced learning“) genannt. Kein menschlicher Input, keine Strategien oder Gewichtungen beeinflussen das Netz, es lernt rein durch ständiges Spielen gegen sich selbst, aber das millionenfach und mit tausenden Instanzen seiner selbst gleichzeitig! So entsteht ein Spielansatz, der mit weit weniger Berechnungen pro Sekunde (nur 80.000) ein tieferes Verständnis der Position, eine scheinbar „menschlichere“ Spielweise ermöglicht als die mehr oder weniger „brute force“ Strategien der meisten herkömmlichen Programme.

It’s more powerful than previous approaches because by not using human data, or human expertise in any fashion, we’ve removed the constraints of human knowledge and it is able to create knowledge itself. (Die AlphaZero-Entwickler)

Also entgegen früherer Ansichten, dass AIs menschlicher sein müßten, geht es hier darum, sämtliche menschlichen Beschränkungen zurückzulassen und eine völlig neue Art des Schachspielens zu ermöglichen.

Im folgenden Video wird exzellent erklärt, wie AlphaZero (mit schwarz) Schritt für Schritt und mit genialen Manövern kleinste Stellungsverbesserungen erreicht (während Stockfish wertlose "Hin- und Her"-Züge macht) und schliesslich Stockfish so an die Wand spielt.

Ein anderes Spiel aus dem Wettkampf, in dem AlphaZero eine geniale Zugzwang-Position erreicht, ist hier von @bartosz546 schön analysiert worden.

Das Match war allerdings nicht ganz fair. Die Stockfish-Entwickler und andere übten folgende Kritik an dem Wettkampf:

Die Entscheidung, die Bedenkzeit pro Zug auf 1 Minute zu beschränken, benachteiligte Stockfish, das komplexe Zeitmanagement-Heuristiken hat, um in kritischen Positionen mehr Rechenzeit zur Verfügung zu haben
Das Nichtverwenden von Eröffnungsbibliotheken und Endspieldatenbanken versursachte einige Eröffnungs-Patzer von Stockfish, das konzipiert ist, solche Hilfsmittel zu verwenden
Es wurde eine ein Jahr alte Stockfishversion verwendet mit zu kleinen Hashtabellen
AlphaZero stand eine höhere Rechenleistung zur Verfügung als Stockfish
Nur 10 der 100 Partien wurden veröffentlicht und der komplette Wettkampf war nicht peer-reviewed

Trotz aller Einschränkungen und dem offenbaren Interesse Googles, sich hier möglichst gut zu verkaufen, ist der Erfolg dieser Art des Lernens (in nur wenigen Stunden Realzeit) und die Art wie AlphaZero spielt unglaublich beeindruckend. Der Schachexweltmeister Garry Kasparov dazu:

„Es ist eine bemerkenswerte Leistung, auch wenn wir das nach AlphaGo erwarten konnten. Wir haben immer angenommen, dass Schach zu viel empirisches Wissen erfordert, als dass eine Maschine es von Grund auf, ohne jedes zusätzliche menschliche Wissen, so gut spielen könnte.

Und der Schachmeister und Sekundant von Magnus Carlsen, Peter Heine Nielsen meinte gegenüber BBC:

"Ich wollte immer schon wissen, wie es wäre, wenn eine überlegene Alienrasse auf die Erde käme und uns zeigen würde, wie sie Schach spielen. Jetzt weiss ich es.

Ein weiterer Meilenstein in der Entwicklung der AI nach 1997, als ein Schachprogramm (Deep Blue von IBM) erstmals einen amtierenden Schachweltmeister besiegt hatte. AlphaZero wird die Art, wie in Zukunft Schach gespielt wird, sicher nachhaltig ändern.

Diese Effektivität beim Selbstlernen ist definitiv ein wichtiger (oder beängstigender?) Schritt hin zur Singularität.

In einem ähnlichen setting schaffte AlphaGo Zero (auch ein Programm von Deepmind) es, nach Erlernens des komplexeren Go ohne menschliche Hilfe in 3 Tagen AlphaGo zu schlagen (das seinerzeits 2016 sensationell den besten Go-Spieler der Welt geschlagen hatte) und in 40 Tagen zum besten Go-Spieler der Welt zu werden und dabei neue Taktiken zu verwenden, die von Menschen bislang auch nach 2500 Jahren (so alt ist dieses Spiel) nicht gefunden wurden. Mehr darüber hier.

An alle Schachinteressierten:

Jeden Samstag um 22h MEZ findet ein #Steemchess Blitzschachturnier (für Menschen 😊)statt, von @schamangerbert grandios organisiert! Wer noch nicht dabei ist, gleich auf lichess.org anmelden und mitmachen! Es ist für Anfänger wie für Geübte geeignet.

https://steemit.com/steemchess/@schamangerbert/reminder-steem-blitz-chess960-tournament-saturday-04-august-20-gmt-erinnerung-steem-blitz-schach-turnier-samstag-04-august-22-00

mehr Infos:
https://nypost.com/2017/12/07/googles-ai-mastered-chess-in-4-hours/
https://www.theguardian.com/technology/2017/dec/07/alphazero-google-deepmind-ai-beats-champion-program-teaching-itself-to-play-four-hours
https://de.chessbase.com/post/alpha-zero-partien-unter-der-lupe

AlphaZero:
https://de.wikipedia.org/wiki/AlphaZero

Deepmind:
https://deepmind.com/

#ai #go #deutsch #steemchess

6 years ago in #chess by stayoutoftherz (68)

$7.45

Sort:

Trending

[-]

felix.herrmann (65) 6 years ago

Bei Poker ist der Rechner mittlerweile auch besser als wir.... Qualityland oder dystopia?

Posted using Partiko Android

$0.03

1 vote

[-]

stayoutoftherz (68) 6 years ago

Poker? Mit einem Roboter, der die Karten hält und seine Mine garantiert keine Emotionen erkennen lässt :) ?

$0.00

1 vote

[-]

felix.herrmann (65) 6 years ago

$0.04

1 vote

[-]

sco (64) 6 years ago

Frage off-topic: Gibt's auch so was wie SteemGo?^^ Würd mich interessieren, spiele das immer in der U-Bahn.

$0.03

1 vote

[-]

stayoutoftherz (68) 6 years ago (edited)

Ich fürchte nein, es sei denn auf den chinesisch- oder koreanischsprachigen Steem-Seiten.
Spielst Du auf https://online-go.com/?
Dort gibt es auch Turniere, Du könntest ja mal eins auf Steemit bringen!

$0.00

1 vote

[-]

sco (64) 6 years ago

ich bin vermutlich ein ziemlicher noob und spiele meistens blitz-spiele gegen den computer. Aber das Spiel ist schon sehr interessant. Ganz anders als Schach, aber sicher nicht weniger strategisch.
Werd mir die Seite mal anschauen, danke.

$0.02

1 vote

[-]

steemstem (73) 6 years ago

This post has been voted on by the steemstem curation team and voting trail.

There is more to SteemSTEM than just writing posts, check here for some more tips on being a community member. You can also join our discord here to get to know the rest of the community!

$0.00

[-]

utopian-io (71) 6 years ago

Hi @stayoutoftherz!

Your post was upvoted by utopian.io in cooperation with steemstem - supporting knowledge, innovation and technological advancement on the Steem Blockchain.

Contribute to Open Source with utopian.io

Learn how to contribute on our website and join the new open source economy.

Want to chat? Join the Utopian Community on Discord https://discord.gg/h52nFrV

$0.00

STEEM 0.30

TRX 0.12

JST 0.033

BTC 63898.89

ETH 3129.16

USDT 1.00

SBD 3.90

Google´s AlphaZero schlägt Stockfish 8, nachdem es sich in 4 Stunden Schach selbst beigebracht hatte!

Diese Effektivität beim Selbstlernen ist definitiv ein wichtiger (oder beängstigender?) Schritt hin zur Singularität.

Hi @stayoutoftherz!

Contribute to Open Source with utopian.io

Coin Marketplace