|
Autor |
Einfache statistische Analyse durchführen (Tennis) |
|
nrch99
Ehemals Aktiv  Dabei seit: 22.01.2017 Mitteilungen: 34
 | Themenstart: 2018-01-28
|
Hallo,
bei den Australian Open im Tennis findet das erste Halbfinale am Donnerstag, das zweite Halbfinale am Freitag und das Finale am Sonntag statt. Somit hat der Sieger des ersten Halbfinale 2 ganze Tage Pause, der Sieger des zweiten Halbfinale nur 1 ganzen Tag Pause. Auf Eurosport wurde gesagt, dass die längere Pause im letzten Jahrzehnt statistisch gesehen keinen Vorteil gebracht habe. Nachdem ich dazu online keine Studie oder Daten gefunden habe, wollte ich mich selbst daran versuchen und das überprüfen.
Der Vorarbeit auf Stackexchange entnehme ich, dass der erste Halbfinalist im Finale 12 von 22 Partien (1997-2018) gewonnen hat. Nun muss ich diese Rohdaten noch bereinigen, und da weiß ich nicht weiter.
Einen Einfluss hat sicher die Platzierung der Finalisten in der Weltrangliste. Angenommen, der erste Halbfinalist war im Schnitt 5 Plätze in der Weltrangliste besser. Wie kann ich das in der Gewinnwahrscheinlichkeit von 12/22 berücksichtigen? Ebenso die im Thread genannte verbrachte Zeit auf dem Platz bis dato, mögliche Verletzungen usw.
Müsste ich dazu als Vergleichswert eine Art historische Gewinnwahrscheinlichkeit ermitteln, z. B. dass ein Fünftplatzierter der Weltrangliste im Schnitt nur 51% der Spiele gegen einen Zehntplatzierten gewinnt, aber bei den Australian Open plötzlich 12/22 = 54% gewinnt?
Mir ist bewusst, dass die Datenmenge sehr gering ist und die statistische Analyse daher wohl nicht so aussagekräftig sein wird, aber es ist einen Versuch wert.
|
Profil
|
Ex_Senior
 | Beitrag No.1, eingetragen 2018-01-28
|
Die Position auf der Weltrangliste erscheint mir kein gutes Kriterium für die Gewinnwahrscheinlichkeit in einem Duell zweier Spieler zu sein, da - unabhängig von den Gegnern - für ein bestimmtes Ergebnis in einem Turnier (Sieg, erreichtes Finale, erreichtes Halbfinale, ... ) immer die gleiche Anzahl an Weltranglistenpunkten vergeben werden.
Sinnvoller erscheint es mir, wenn man (historische) Elo-Daten verwendet: Analog der Spielstärke im Schach gibt es garantiert irgendwo im Netz auch Daten, welcher Spieler wann welche Spielstärke besaß. Das gute daran ist, dass man aus der Differenz der Elo-Werte zweier Spieler direkt deren Gewinnwahrscheinlichkeiten in einem Duell, egal bei welchem Turinier und in welcher Runde dies stattfindet, berechnen kann.
Ich habe aber danach gerade nicht gesucht.
Cyrix
|
Profil
|
Kitaktus
Senior  Dabei seit: 11.09.2008 Mitteilungen: 7144
Wohnort: Niedersachsen
 | Beitrag No.2, eingetragen 2018-01-29
|
Ein Problem ist dabei allerdings, dass beim Tennis der Untergrund eine gewisse Rolle spielt.
Darüber hinaus wird der Ansatz bei dieser Datenlage aber kaum zum Erfolg führen.
Eine signifikante Abweichung vom Erwartungswert (Wsk. kleiner 5%) stellen 12 Siege in 22 Spielen nur dann dar, wenn die angenommene Siegwahrscheinlichkeit für den ersten Halbfinalisten unter 35,3%(*) liegt.
Also nur dann, wenn die Spielstärken-Analyse zu einem Ergebnis führt, die den jeweils ersten Halbfinalisten auf Grund seiner Weltranglistenposition oder ELO-Zahl im Mittel deutlich im Nachteil sieht, wären 12 Siege aus 22 Partien statistisch auffällig.
Zu guter Letzt kann es auch durchaus sein, dass man Ansetzungsbedingte Vorteile einiger Spieler durchaus in Kauf nimmt.
Durch das Setzen von Spielern haben z.B. in der Rangliste höher platzierte Spieler auch eine höhere Wahrscheinlichkeit Halbfinale oder Finale zu erreichen als gleichgute Spieler die aber (warum auch immer) in der Rangliste niedriger platziert sind.
Hier nimmt man also auch die Benachteiligung von Spielern in Kauf, um den Zufallseinfluss auf das Turnierergebnis zu senken und die Spannung bis zum Finale hochzuhalten.
(*) In dem verlinkten Artikel war von 12 Siegen in 21(!) Partien die Rede. Das verschiebt diesen Wert auf 37,2%.
Spielt der auf Platz 1 gesetzte Spieler eigentlich in der 1. oder 2. Hälfte des Turnierbaums? Landet er also im 1. oder im 2. Halbfinale, fall er alle Spiele gewinnt?
|
Profil
|
nrch99
Ehemals Aktiv  Dabei seit: 22.01.2017 Mitteilungen: 34
 | Beitrag No.3, vom Themenstarter, eingetragen 2018-01-31
|
Vielen Dank für die Antworten. Ihr habt Recht, dass die Weltrangliste an sich nicht so gut geeignet wäre. Tennis-ELO-Zahlen scheint es tatsächlich zu geben, ich habe aber nur kurz geguckt (erster google-Treffer: http://tennisabstract.com/reports/atp_elo_ratings.html ).
\quoteon(2018-01-29 18:39 - Kitaktus in Beitrag No. 2)
(*) In dem verlinkten Artikel war von 12 Siegen in 21(!) Partien die Rede. Das verschiebt diesen Wert auf 37,2%.
Spielt der auf Platz 1 gesetzte Spieler eigentlich in der 1. oder 2. Hälfte des Turnierbaums? Landet er also im 1. oder im 2. Halbfinale, fall er alle Spiele gewinnt?
\quoteoff
In die Gewinnquote habe ich 2018 einbezogen (Sieger war der 2. Halbfinalist), also 12/22 statt 12/21. Meines Wissens ist der an Platz 1 gesetzte Spieler immer in der oberen Hälfte und die obere Hälfte spielt immer als erstes die 1. Runde, 2. Runde usw, also auch das 1. Halbfinale.
|
Profil
|
nrch99 hat die Antworten auf ihre/seine Frage gesehen. |
|
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2023 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen. Lesen Sie die
Nutzungsbedingungen,
die Distanzierung,
die Datenschutzerklärung und das Impressum.
[Seitenanfang]
|