DSOL Runde 4: Hellern 2 dreht das Match!

Das Erfreuliche: mit zwei spielstarken Leistungen an Brett 3 und 4 drehten Franz Ernst und Stefan Ewert das Match gegen den Münchener SC, der zunächst dank einer spektakulären Leistung ihres Spitzenspielers und einem Remis an Brett in Führung gegangen war. Das Unerfreuliche: Ging alles korrekt zu? Es mehren sich die Verdachtsmomente, dass auch die DSOL ein Problem mit Cheating hat.

Hellern grüßt von oben – zumindest vorerst!

Unsere gefürchteten Vier sorgten am Montag für den dritten Saisonsieg und dürften bei konstanten Leistungen einen Platz unter den ersten drei Mannschaften erreichen können. Ob es zu mehr reicht? Ohne Glück ist das erst mal sehr unwahrscheinlich – zu dominant war bislang das Team aus Bremerhaven aufgetreten. Hier passt aber die Binse, dass man sich eben auf das nächste Match konzentrieren sollte. Alles andere wird man dann sehen.

Quelle: Deutscher Schachbund

Für die Kiebitze war es ein erfreulicher Abend: die Partien waren spannend. Gerade die menschlichen Fehler machen den Reiz beim Rapidschach aus. Da reicht es manchmal halt nicht, wenn man auf Gewinn steht, obwohl eine Gewinnstellung gelegentlich hilfreich ist 🙂

Der Münchener SC gehört zu den großen Traditionsvereinen. Kein Wunder: er ist der drittälteste Schachverein in Deutschland. Insgesamt achtmal gewann der Klub die Deutsche Mannschaftsmeisterschaft. Zu den Topspielern gehörte die Legende Wolfgang Unzicker. Heute spielen die Münchener mit Spielern wie GM Gawain Jones und GM Alireza Firouzja in der 2. Bundesliga Ost. Natürlich ganz oben.

Zuletzt geschah 11.h3. Nun gewann 11…Se4!

Unsere Zweite musste sich dagegen mit Spielern auseinandersetzen, die im Mittelfeld der internen Ratingliste stehen. Der SC ist halt ein mitgliederstarker Verein. Dass es trotzdem nicht leicht werden würde, sah man an Brett 2, wo Patrick Meyjohann sich freuen durfte, dass sein Gegner einen einzügigen Gewinn übersah. Nach 11.h3 folgte das gewiss nicht schlechte 11…Lxf2. Nach 11…Se4! wäre Weiß überhaupt nicht mehr zu retten gewesen. Patrick verteidigte sich danach ansprechend und nach einer weiteren Ungenauigkeit von Dr. Schleich konnte er Remis anbieten.

 

Derweil ging Cervantes-Fan Joachim Rein am Spitzenbrett gegen Uwe Böhm unter. Der Münchener spielte bärenstark, hinterließ aber beim Berichterstatter ein Geschmäckle. Denn Joachims Gegner gelang am Ende der Partie eine sagenhafte Serie von 21 Zügen, die auch Stockfish 12 ad hoc gespielt hätte. Ich habe einige GM-Partien untersucht und eine wird von mir auch vorgestellt. Das Ergebnis: selbst Caruana und Carlsen gelangen keine so langen Zugsequenzen. Dazu später mehr. Auf jeden Fall war dies die Führung für die Münchener.

Hier hätte 27.Txe6 fxe6 28.Sxe6 für Unruhe gesorgt!

Menschlicher ging an Brett 4 zu, wo der Berichterstatter Blut und Wasser schwitzte, als er sah, dass Stefan Ewert gegen Konstantinos Tsakonas mit h7-h5 und g7-g5 in positioneller Gewinnstellung die Stellung öffnete. Schachfreund Tsakonas ist – falls ich richtig recherchiert habe – ein 12-jähriges Nachwuchstalent, das auch in seiner Verluststellung hart fightete und einmal sogar eine fette Mogelchance hatte – wenn er richtig geopfert hätte, wäre Stefan zu enormer technischer Genauigkeit gezwungen gewesen. Das Opfer blieb aus und Stefan spielte alles technisch und taktisch sehr stark runter.

 

Hier gewann Dh7xg6 wegen der Springergabel auf e6.

Den Sack machte dann Franz Ernst zu. Die Gegenwehr von Bernd Gruber war aber erheblich. Das hätte Franz vermeiden können, wenn er – wie er es für Hellern mindestens zweimal erfolgreich getan hatte – ganz einfach (!?) die Dame geopfert hätte. So musste er ins Endspiel, das Remis war, für SF Gruber  aber schwer zu verteidigen war. Franz hatte die konkreten Drohungen, sein Gegner hätte perfekt spielen müssen – und so nahm alles einen guten Ausgang für uns. Allerdings einen glücklichen, denn die Münchener hätten mit mehr Glück und konsequenterer Taktik diesen Wettkampf gewinnen können.

Nachspiellink

 

Cheating im Schach lässt sich nicht beweisen

Das Thema ist Cheating ist unangenehm, weil es komplizierter ist als man zunächst glaubt. Man möchte Gewissheit, aber die gibt es nicht oder nur selten. Klar, wenn man jemanden mit einem Smartphone auf der Toilette vorfindet und dazu noch ein App mit der aktuellen Stellung entdeckt wird, ist die Sache wohl wasserdicht. Das ist Cheating, man hat einen Beweis, und Ausreden des Ertappten wirken kaum noch glaubhaft.

Findet man in einer Schachpartie eine lange Serie von Zügen, die auch von einer starken Engine gespielt worden wären, begegnen wir einem anderen Problem: dem von Korrelation und Kausalität. Dieses Problem ist besonders in der Statistik wichtig. Entdeckt man nämlich eine Beziehung zwischen zwei Variablen, so ist ein Zusammenhang denkbar. Dies wäre z.B. die Beziehung zwischen den gespielten Zügen und den Zugvorschlägen der Engine. Diese Beziehung kann allerdings durch weitere Variablen beeinflusst werden, sodass man eine Kausalität nicht nachweisen kann. Mit anderen Worten: man kann sich bestenfalls ein persönliches Urteil über die Wahrscheinlichkeit einer kausalen Beziehung bilden.
Das Anti-Cheating-Team der DSOL hat allerdings die unangenehme Aufgabe, Entscheidungen zu treffen, die möglicherweise einen Unschuldigen diskreditieren. Die folgenden Ausführungen müssen daher nicht nur methodisch begründet sein, sondern sie müssen auch alle plausiblen Gegenargumente berücksichtigen. In der erwähnten Partie zwischen Joachim Rein und Uwe Böhm hat jeder danach die Freiheit zu beurteilen, ob 21 Enginezüge etwas mit 21 identisch gespielten Zügen des Müncheners zu tun haben.

Definitionen

Wie denifiert der Deutsche Schachbund das sogenannte Cheating?

„In Entsprechung der AC-Reg. (Ziff. I.2) hat §61a Abs. 2 DSB-Satzung den Begriff des „Cheating“ wie folgt definiert: Cheating begeht, wer

  • a) es unternimmt, während einer Partie ohne Zustimmung des Schiedsrichters ein elektronisches Gerät oder eine andere unzulässige Informationsquelle zu benutzen oder sich hieran zu beteiligen,
  • b) es unternimmt, Ergebnisse von Schachpartien oder Schachturnieren mit unlauteren Mitteln zu verfälschen oder sich hieran zu beteiligen (Ergebnisabsprachen, Verfälschung von Ergebnissen oder Ratingzahlen, Täuschung über Personenidentität, Teilnahme an fiktiven Partien oder Turnieren und Ähnliches),
  • c) einen anderen vorsätzlich oder grob fahrlässig fälschlich beschuldigt, einen der Verstöße nach Buchst. a) oder b) begangen zu haben.“

Quelle: Deutscher Schachbund – Informationen der Spielleitung, 6.12.2020 (Bitte als Suchbegriffe in Google „kriterien für cheating im schach“ eingeben! Die zitierten Ausführungen beziehen sich auf Wettbewerbe der Deutschen Einzel- und Mannschaftsmeisterschaften.) Infolgedessen wäre ich ein Cheater, wenn ich grob fahrlässig einen Schachspieler des Betrugs bezichtige. Das tue ich nicht, vielmehr sollen Aspekte eines Problems diskutiert werden, das vielen Schachspielern Kopfzerbrechen bereitet.

Und die Praxis?

Gleichwohl hat das Anti-Cheating-Team der DSOL auf der Homepage des Veranstalters eine klare Bewertung des Sequenzproblems vorgenommen: „Wichtig ist zum Einen die Anzahl der Übereinstimmung mit Kandidatenzügen eines Computerprogramms über mehrere Zugfolgen hinweg. Dabei ist nicht entscheidend, ob die Mitglieder des Schiedsrichterteams selbst auf den ausgeführten Zug gekommen wären; das kann bei jedem Zug passieren. Aber wie groß ist die Wahrscheinlichkeit, dass ein Spieler unterhalb des Weltklasseniveaus nahezu jeden Partiezug fehlerfrei spielt; und das auch noch in mehreren Partien hintereinander?“

Eine gute Frage, die eigentlich gleichzeitig beantwortet wurde. Nun ist es aber so, dass auch ein Spieler der 1. Mannschaft des SV Hellern einen Verdacht hatte. Reinhold Happe hatte in mehreren Partien Korrelationen entdeckt, aber nur in einem Fall Beschwerde eingelegt, weil es sich um den Spieler eines Teams handelt, das noch gegen uns antreten muss.
Obwohl die oben zitierten Kriterien des Anti-Cheating-Teams übererfüllt waren, wurde die Beschwerde zurückgewiesen: „Der Fehlerwert liegt mit 0,14 zwar recht niedrig. Doch bietet der Partieverlauf keine belastbaren Hinweise auf die Nutzung einer Engine. Dabei muss auch berücksichtigt werden, dass es sich um eine Partie der 1. Liga handelt, in der ein gewisses schachliche Niveau unterstellt werden darf.“ In der Folge wurde der Bescheid auch mit rein schachspezifischen Stellungscharakteristika begründet, was methodisch zu diskutieren wäre.
Im diesem Fall habe ich Reinhold Happes methodisches Vorgehen geprüft. Mit Stockfish 12 entdeckte ich nichts. Mit Stockfish 11 kam ich bis auf 2-3 Züge zu einem identischen Ergebnis.

Es wird jeden Tag betrogen

Wie gesagt: es wurden Korrelationen nachgewiesen, aber keine Kausalität. Wie groß der Bewertungsspielraum ist, hat diese Angelegenheit aber sehr deutlich gezeigt. Um fair zu sein, sei bemerkt, dass ein großer Anbieter wie chess.com derartige Korrelationen weitgehend ignoriert – es sei denn, ein Amateur erzielt gegen einen Großmeister 99%. Aber Chess.com ist klar: „Es wird jeden Tag betrogen.“
Chess.com hat mittlerweile 400.000 Konten geschlossen und rechnet bis Mitte 2023 mit dem Überschreiten der Millionengrenze. Erschreckend: selbst Titelträger cheaten. Chess-com bilanziert: „Von den des Betrugs überführten Titelträgern waren 46 (12.6%) Großmeister. Acht davon (17.4%) haben eine Elo von über 2600. 80 (22%) waren Internationale Meister und 118 (32.4%) FIDE Meister. 95.43% waren männlich und 4.57% weiblich.“
Ansonsten hält sich chess.com bedeckt, was die eigenen Methoden zur Ermittlung von Cheatern betrifft. Der Computer Aggregated Precision Score (CAPS) ist es nicht: „Selbst Anfänger können sehr hohe Genauigkeitswerte erzielen, wenn ihr Gegner frühzeitig einen groben Fehler begeht und die Stellung danach sehr einfach zu spielen ist.“

CAPS ist ein Methode, mit der die Genauigkeit von Zügen im Vergleich zu einer Engine untersucht wird. Magnus Carlsen erreicht einen Wert von 98.36 und eine bereinigte ELO-Zahl von 2961. Im Vergleich dazu ist die von SF Happe und mir verwendete Methode vergleichsweise gröber. Wobei ich mich formal nur für Korrelationen interessiere, aber nicht dafür, ob in einer Sequenz plausible Züge (etwa nach einem Figurentausch) erfolgten. Auch deshalb müssen folgende Faktoren berücksichtiget werden:

  • Sind Korrelationen aussagekräftig, wenn die Engine-Bewertungen von der Hardware des Computers und den Einstellungen der Engine abhängen und geringe Veränderungen zu anderen Ergebnissen führen?
  • Ist es aussagekräftig, wenn man Korrelationen mit Stockfish 11 nachweist, aber dies mit Stockfish 12 misslingt?
  • Und ist die Auswertung einer einzigen Partie ein Indiz für die Vermutung, dass ein Spieler eine Engine benutzt hat? Im vorliegenden Fall habe ich eine weitere Partie des genannten Spielers untersucht. Es gab auch dort Korrelationen, aber nicht in dem Umfang, wie sie in der aktuellen Partie ermittelt wurden.

Das größte Handicap für eine gewünschte, aber wohl kaum zu erzielende Gewissheit sind die „False Positive“-Ergebnisse. Jeder Schachspieler hat einen „Sahnetag“, an dem einfach alles stimmt. Muss jemand mit Sanktionen rechnen, nur weil er in einer Partie fast perfektes Schach gespielt hat? Ich habe einige Tausend Partien analysiert und kenne die Fälle, in denen in einer Oberliga-Partie Sequenzen von 10-12 Zügen zustande kamen. Und ich kenne die Partien von Spielern <DWZ 1800, die vom ersten bis zum letzten Zug zwar keine Züge wie die der Engine spielten, aber durchgehend eine Genauigkeit von 0.00 erreichten – also perfekt und fehlerfrei spielten. Und das sehr häufig.

Fazit: die von mir und SF Happe gewählte Methode ist nicht geeignet, um Cheating zu beweisen. Sie legt aber nahe, dass zumindest ein Anfangverdacht plausibel ist. Im Umkehrschluss bedeutet dies nicht, dass die aktuelle Veranstaltung so sauber ist, dass bislang nur ein Spieler vom Turnier ausgeschlossen werden musste. Und wenn das Anti-Cheating-Team anführt „Geprüft wird zum Anderen auch der Bedenkzeitverbrauch gerade in taktisch kritischen Positionen“, so ist auch dies methodisch grenzwertig, da jeder Cheater natürlich Nachdenkphasen simulieren kann. Wenn aber ein Spieler nach sechs Minuten einen Zug spielt, den die Engine zunächst nicht berücksichtigte, dann aber nach sechs Minuten +- 10 sec dann doch spielt, so ist dies ein härteres Argument als die Einschätzung von Bedenkzeiten.

Zielführend sind daher also nicht Spekulationen über Wahrscheinlichkeiten, auch nicht Mutmaßungen über Verhaltensweisen, sondern ein transparenter Kriterienkatalog. Dass sich Ausrichter dabei vor „False Positive“-Ergebnissen fürchten, ist nachvollziehbar. Für mehr Fairness beim Online-Schach reicht dies aber nicht aus. Daher der Vorschlag: wenn jemand in mehr als drei Partien ununterbrochene Sequenzen von mehr als 12 Zügen produziert, die in jedem Fall eine Korrelation zu einer (!) bestimmten Engine aufweisen, darf man annehmen, dass etwas faul ist im Staate Dänemark.

Fotos: © Hellern-Archiv 2018-2021