„Prognosen sind schwierig, vor allem wenn sie die Zukunft betreffen“

Jedes Jahr das gleiche Spiel: Vor der Saison schauen sich alle die neuen Ratinglisten an und wollen wissen, er auf- und wer absteigt. Jörg Stock sieht dies als Mathematiker anders. Rätselraten kommt für ihn nicht in Frage. Zahlen werden in Beziehung zueinander gesetzt und dann interpretiert. Für die neue Oberliga-Saison hat er ein völlig neues Modell entwickelt, das noch genauer einen Blick in die Zukunft unserer Ersten wirft.

Anm.: der Red.: Jörg Stock hat mit immensem Fleiß eine Analyse erstellt, die es so wohl noch nie im Schach gegeben hat. Das ist ein Stück Pionierarbeit. Die Orignaltabelle ist in der für eine gute Lesbarbeit erforderlichen Auflösung ca. 35 cm breit. Wir haben aber nur ein 4:3-Kino und können kein Cinemascope zeigen. Deshalb wurde die Tabelle in passende Segmente unterteilt, die passend zum jeweiligen Thema eingebaut worden sind. Wer alles auf einen Blick sehen will, muss auf die erste Grafik klicken.  


Schach-hellern.de: Wenn ich an die Überschrift denke, die du für den Beitrag gewählt hast, fällt mir die Numerologie ein. Aber diese Zahlenmystik hat ja eher etwas mit Aberglauben zu tun. Dagegen hoffen ja viele, dass man mit statistischen Methoden der Zukunft wirklich ein Schnippchen schlagen kann. Kannst du die Zukunft unserer Ersten vorhersagen?

Stock: Dieses bekannte Zitat trifft auf den Schachsport nur bedingt zu. Denn mit dem mathematischen Wahrscheinlichkeitsmodell, das hinter den bekannten Ratingverfahren ELO und DWZ steckt, lassen sich bereits gute Vorhersagen treffen. So zum Beispiel mit dem LigaOrakel. Zumal Faktoren wie Zufall und externe Umwelteinflüsse beim Schachsport in der Regel keinen nennenswerten Einfluss auf die Ergebnisse haben.

Schach-hellern.de: Gut, aber bei 30 Grad im Schatten dürften die meisten Schachspieler irgendwann einknicken.

 

Eine neue Rangordnung

 

Stock: Das will ich nicht abstreiten. Dennoch gibt es auch einige „weiche“ Faktoren, die besonders bei Teamwettkämpfen nicht unterschätzt werden sollten. Meine Idee war daher, ausgehend von der üblichen Berechnung des ELO/DWZ-Durchschnitts, durch ein Bonus-/Malus-System, welches für positive Faktoren Aufschläge und für negative Abschläge vergibt, ein modifiziertes Gesamtrating und damit eine neue Rangordnung zu ermitteln.
Ich habe dazu drei wesentliche Faktoren identifiziert und versucht in meine Prognose für die Oberligasaison 2017/2018 einzubeziehen. Diese drei zusätzlichen Faktoren habe ich mit Homogenität, Stabilität und Potenzial bezeichnet.

Die Rechtfertigung dieses Ansatzes habe ich aus der Tatsache abgeleitet, dass in den vergangenen Jahren immer wieder Mannschaften den Aufstieg in die 2.Liga schafften, die nominell nicht der Favorit waren, sich aber durch eine große Homogenität und Stabilität ausgezeichnet haben. Zum Beispiel Uelzen, 2-mal Oldenburg oder HSK Lister Turm.
Meine Prognose basiert insgesamt auf fünf Kennziffern, die ich zunächst kurz erläutern möchte: Das ist zunächst die Spielstärke der Stammmannschaft, also der TOP 8.

Schach-hellern.de: Die lässt sich einfach ermitteln. Alle Ratings addieren und durch 8 teilen. Fertig.

Stock: Dies bildet natürlich auch in meinem Verfahren die Basis der Vorhersage. Allerdings habe ich bereits einen modifizierten Ansatz gewählt. Verwendet wurde nicht alleine die ELO-Zahl, wie auf der Homepage der Oberliga und damit auch beim LigaOrakel, sondern der Mittelwert aus ELO und DWZ. Dies führt meines Erachtens zu genaueren Einschätzungen, fließen doch in die DWZ sämtliche Turniere eines Spielers ein, während ELO-Auswertungen weiterhin meist nur für höherrangige Turniere erfolgen. Spieler die im Vorjahr keinerlei Einsatz hatten, habe ich gestrichen. Bei Neuzugängen in der ersten Acht habe ich allerdings unterstellt, dass diese auch zum Einsatz kommen werden.

(Für eine größere Ansicht der gesamten Tabelle auf das Bild klicken)

Schach-hellern.de: Mit dieser Methode hast du also für den Aufsteiger Lingen in der ersten Spalte, also „Spielstärke TOP 8“ den Wert 2483 ermittelt?

Stock: Genau, aber das reicht nicht. Denn die ersten Acht spielen ja nicht immer. Deshalb wurde im zweiten die Spielstärke der zu erwartenden Ersatzspieler berücksichtig. Hier wurden die 4 Spieler hinter der Top 8 berücksichtigt, allerdings auch nur dann, wenn sie im Vorjahr aktiv waren, d.h. in der Ersten, Zweiten oder einer anderen Mannschaft des Vereins gespielt haben, um Karteileichen zu eliminieren.

(Tabellenausschnitt 1)

Schach-hellern.de: Ich sehe gerade, dass mir das Ergebnis nicht gefällt. Lingen steht in der Spalte „Spielstärke Ersatz“ ja auch auf Platz 1. Die sind ja im Schnitt besser als die besten Top 8 der anderen Vereine. Und Hellern ist am drittschlechtesten.

Stock: Tja, Lingen spielt natürlich in dieser Saison eine Ausnahmerolle. Ich befürchte, denen ist auch mit der größten Stabilität nicht beizukommen. Aber nun zu den anderen Kennzahlen. Da wäre zunächst die Differenz zwischen dem Wertungsbesten und Wertungsschlechtesten Spielers der TOP 8 – von mir als Min/Max-Wert bezeichnet.

Schach-hellern.de: So ganz verstehe ich das nicht. Wenn ich sieben GM mit 2500 aufstelle und hinten einen 1800er, dann habe ich einen Min/Max-Wert von ca. 700. Die Mannschaft als Ganzes ist aber saustark. Acht 2100er haben dagegen einen Min/Max-Wert von Null. Was soll uns das denn sagen?

Stock: Man muss halt mit Durchschnittswerten arbeiten. Zudem geht es bei den weichen Faktoren wie bereits erwähnt nur um Zu- bzw. Abschläge auf das statistisch ermittelte Rating. Deine Beispiel-Mannschaft würde ja in der Gesamtbetrachtung dennoch weit vorne liegen und ist auch nicht typisch.
Ich halte diesen Wert aber für aussagekräftig hinsichtlich der Homogenität einer Mannschaft. Gibt es eine große Diskrepanz kann zum Beispiel ein unerwarteter Verlust eines nominell klar favorisierten Spitzenspielers möglicherweise nicht durch den Rest der Mannschaft kompensiert werden. Zudem besteht bei einem leistungsmäßig deutlich abfallenden Spieler die Gefahr, dass dieser durch ein negatives Einzelergebnis zu einer Belastung für die Mannschaft wird.

(Tabellenausschnitt 2)

 

Min/Max, Quote, Alter

 

Schach-hellern.de: Was bedeutet denn die Einsatzquote Top 8?

Stock: Das ist einfach. Hier wird die durchschnittliche Partienzahl der Stammformation ins Verhältnis zur Maximalzahl von 9 Partien gesetzt. Je höher die Quote, desto weniger fehlen Stammkräfte und um so  stabiler ist das Team. Zudem sinkt bei einer niedrigen Quote auch die Spielstärke des Teams, da die Ersatzspieler in der Regel schlechtere Ratings haben als die Top 8.

Schach-hellern.de: Na ja, nicht immer. Aber wir wollten ja nicht mehr über Lingen reden. Hellern ist also mit 86% eine starke Truppe?

Stock: Ja, hoffentlich bleibt das so. 90% wären natürlich noch besser.

Schach-hellern.de: Gut, das ist nachvollziehbar. Kommen wir zum Durchschnittsalter der TOP 8. Ältere Spieler sind ja erfahren. Soll das plötzlich ein Nachteil sein?

Stock: Zunächst habe ich anhand der Geburtsjahrgänge aus der ELO-Datenbank das Durchschnittsalter der Stammformation ermittelt. Hintergrund ist die berechtigte Annahme, dass jüngeren Spieler erfahrungsgemäß noch ein höheres Steigerungspotential zugebilligt werden muss, was zur Folge hat, dass diese möglicherweise noch unterbewertet sind. Dies berücksichtigen übrigens auch das ELO- und das DWZ-System durch altersabhängige höhere Gewichtungsfaktoren des neuesten Turnierergebnisses. Umgekehrt profitieren ältere Spieler oftmals noch von Ratingzahlen aus der Vergangenheit. Tendenziell ist aber von rückläufiger Spielstärke auszugehen.
Die Schwierigkeit besteht nun darin, aus der beschriebenen Datenbasis geeignete Auf- und Abschläge auf die reine ELO/DWZ-Spielstärke zu ermitteln. Wie ich bei den drei beschriebenen „weichen“ Faktoren vorgegangen bin, beschreibe ich gleich. Ich möchte aber darauf hinweisen, dass ich die Ansätze zwar für plausibel halte, mathematische oder empirische Beweise kann ich aber vorerst nicht liefern 🙂

 

„Homogenität, Stabilität & Potential“

 

Schach-hellern.de: Und wie setzt Du dieser Werte miteinander in Beziehung?

Stock: Fangen wir mit der Homogenität an. Die Differenz vom Min/Max-Wert eines Teams zum durchschnittlichen Min/Max-Wert der Liga wurde durch 8 geteilt, das ist bekanntlich ja die Mannschaftsstärke. Ist der Wert positiv, wird er in Abzug gebracht, ist er negativ, wird er zu einem Bonus. Das homogenste Team ist demnach der HSK Lister Turm mit einem Wert von 100, was einen Bonus von 19 Punkten einbringt. Den höchsten Wert haben wir mit 425, was für uns einen Malus von 21 Punkten bedeutet.

Schach-hellern.de:  Dann ist der Lister Turm also mit seinen plus 19 besser als wir mit minus 21?

Stock: Ja leider. Aber wir haben im Bonus- und Malus-System noch zwei weitere Faktoren. Das ist zunächst die Stabilität. Hier wird die Einsatzquote der Top 8 mit der Spielstärke der Top 8 multipliziert und die Restquote mit der Spielstärke der Ersatzspieler. Die Summe daraus wird von der Top 8-Spielstärke abgezogen und in der Gesamtbetrachtung als Malus berücksichtigt. Logischerweise gibt es hier für alle Teams negative Werte, da die Ersatzspieler im Schnitt schlechtere Ratings haben als die Stammformation. Allerdings treten hier zwei Effekte gleichzeitig auf. Natürlich wirkt sich eine geringere Einsatzquote negativ aus, hat man allerdings überdurchschnittlich gute Ersatzspieler kann dieser Effekt gemildert werden. Das stabilste Team ist übrigens der Hamelner SV mit einer Einsatzquote von 94%, was nur 6 Punkte Abzug bedeutet. Der SV Lingen bringt es hier nur auf 58%, was zwar einen Malus von 102 Punkten einbringt, an der Favoritenstellung aber nicht viel ändern kann.

(Tabellenausschnitt 3)

Schach-hellern.de: Der letzte Punkt ist das Potenzial. Das ist bekannterweise ein Mysterium. Aber du hast auch das mathematisch bewertet.

Stock: Tatsächlich ist es hier am schwierigsten, einen zahlenmäßigen Ansatz zu finden. Ich habe mich dafür entschieden einem Team für jedes Jahr, das es im Schnitt jünger ist als der Ligaschnitt (41 Jahre) 2 Bonuspunkte zu geben, und umgekehrt 2 Maluspunkte pro Jahr für über dem Schnitt liegende Teams. Mit anderen Worten könnte man also sagen, einem 16 jährigen Spieler (25 Jahre jünger als der Ligaschnitt) wird ein Steigerungspotenzial von 50 Punkten in der Saison zugetraut. Das ist meiner Meinung nach  ein vertretbarer Ansatz. So betrachtet bekommt das Team von Nordhorn-Blanke, mit 32,3 Jahren das jüngste in der Liga, einen Zuschlag von 17 Punkten, während die Bremer SG mit einem Altersschnitt von 58,5 Jahren einen Abzug von 35 Punkten zu verkraften hat.

Schach-hellern.de: Na ja, immerhin konnten wir hier endlich mal Punkte sammeln. Ändert aber nichts daran, dass wir bei der Homogenität und der Stabilität gewaltige Abzüge hinnehmen müssen. Insgesamt werden uns aufgrund deiner Berechnung glatte 37 Punkte von unsere Top 8-Spielstärke abgezogen. Das kostet uns zwei Plätze, wenn man das Ergebnis mit der Top 8-Rangliste vergleicht.

Stock: Damit müssen wir leben, ein Aufstiegskandidat sind wir offensichtlich nicht. Klarer Favorit ist und bleibt der Aufsteiger aus Lingen. Und fast ebenso klarer Kandidat für Platz 2 ist der Absteiger aus der 2.Liga, der HSK Lister Turm. Wir fallen bei meiner modifizierten Betrachtung zwar von Platz 3 nach reiner Spielstärke auf Platz 5 zurück, sollten aber mit Nordhorn und Delmenhorst dennoch um die Plätze 3-5 spielen können. Das aber auch nur, wenn wir eine ähnliche Stabilität erreichen wie in den Vorjahren. Die Stabilität ist letztlich auch der einzige Faktor, den man während der Saison noch beeinflussen kann. Die restlichen 5 Mannschaften liegen nicht weit auseinander, was einen sehr harten und spannenden Abstiegskampf erwarten lässt. Ich bin schon jetzt sehr gespannt, wie gut ich mit meiner Prognose liegen werden. Rechne aber auch damit, dass ich das Verfahren im nächsten Jahr möglicherweise noch weiter justieren muss. Zudem lade ich alle interessierten Leser, ein in die Diskussion über die Sinnhaftigkeit meines neuartigen Ansatzes und auch die mathematischen Ansätze für die Bewertung der „weichen“ Faktoren einzusteigen.

Schach-hellern.de: Auf jeden Fall war das ein spannender Einblick. Ich habe zwar nicht alles verstanden, aber mit dem 5. Platz kann ich leben. Wenn du dich bloß nicht verrechnet hast … 🙂

(Das Gespräch führte Dr. Ortwin Thal)

Grafiken: © Stock 2017