Explorable Data Science

Streichholzschachtel Computer (MENACE)
Quadrate in 4x4-Raster mit Flexbox


MENACE

Die Idee, einen Computer zu bauen, der in der Lage ist Tic-Tac-Toe zu spielen, kam Donald Michie in den 1960er Jahren. Da ihm zu dieser Zeit kein Computer zur Verfügung stand, verwirklichte er seine Idee mit etwa 304 Streichholzschachteln und zahlreichen Perlen. Er nannte seine Maschine MENACE (Matchbox Educable Noughts And Crosses Engine). Das Besondere an MENACE ist ihr Lernalgorithmus, mit dem sie in der Lage ist, Tic-Tac-Toe zu spielen.

Die Funktionsweise von MENACE stellt eine frühe Form des Reinforcement Learning dar. Hierbei lernt ein Agent (in diesem Fall MENACE) durch Interaktion mit seiner Umgebung (Tic-Tac-Toe). Zu Beginn sind alle möglichen Spielzüge von MENACE gleich wahrscheinlich. Aber je mehr Spiele sie spielt, desto wahrscheinlicher wählt sie die erfolgversprechenden Züge aus. Dies basiert auf einem Belohnungssystem, das durch die Anzahl der Perlen repräsentiert wird. Wenn MENACE’s Züge zu einem Sieg führen, wird sie “belohnt”, indem mehr Perlen, die diesen erfolgreichen Zug repräsentieren, hinzugefügt werden. Führen ihre Entscheidungen jedoch zu einem Verlust, werden Perlen als “Bestrafung” entfernt.








Trotz sorgfältiger inhaltlicher Kontrolle übernehmen wir keine Haftung für die Inhalte externer Links. Für den Inhalt der verlinkten Seiten sind ausschließlich deren Betreiber verantwortlich.