Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Fußball: Gewinn, Verlust, Unentschieden

Fußball: Gewinn, Verlust, Unentschieden

Universität / Fachhochschule

Tags: Auswertung, Fußballtabellen, quoten, Wahrscheinlichkeit

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
DieterKruesemann

DieterKruesemann aktiv_icon

21:15 Uhr, 10.05.2023

Antworten
Guten Abend,

mein Kumpel und ich diskutieren schon seit mehreren Tagen, wann
statistische Daten voneinander abhängig sind oder nicht und was
das bedeutet, wenn die Daten miteinamder verknüpft werden sollen.

Konkret geht es um Fußballtabellen, die für jeden Spieltag je
Mannschaft darstellen, getrennt nach Heim- und Auswärtsspielen,
wieviele Spiele gewonnen bzw. verloren wurden und unentschieden
ausgingen, weiterhin erscheinen die Summen über die erzielten
und kassierten Tore.

Erste Frage: sind die Heim- und Auswärtstabellen statistisch
voneinander abhängig, weil sie die Ergebnisse ein und derselben
Liga darstellen oder sind die Tabellen voneinander unabhängig,
weil die Torchancen beider Mannschaften in der Regel verschieden
sind (Heim- bzw. Auswärtsstärke)?

Aus den Tabellen ergeben sich für die bisherigen Spieltage die
durchschnittlichen Werte für pro Tag gewonnene, verlorene und
unentschiedene Spiele und die durchschnittlich erzielten bzw.
kassierten Tore. Weiterhin lassen sich damit für den jeweiligen
Tag die durchschnittlichen Wahrscheinlichkeiten für gewonnene,
verlorene und unentschiedene Spiele ableiten.

Je nach Ergebnis der ersten Frage die zweite Frage: Wie sind die
Tabellenwerte zu verknüpfen, damit sich die Wahrscheinlichkeiten
für den Gewinn der Heim- oder Auswärtsmannschaft bzw. für ein
unentschiedenes Spiel ergeben?

Verfügbare Wahrscheinlichkeitswerte p für:

Heimmannschaft (Index 1)
p1(w) Heim gewinnt (won)
p1(d) Heim spielt unentschieden (draw)
p1(l) Heim verliert (lost)

Auswärtsmannschaft mit Index 2, ansonsten analog Heimmannschaft.

Beispiele für mögliche Verknüpfungen für das aktuelle Spiel zur
Ermittlung der Wahrscheinlichkeit, dass "Heim" gewinnt (Index h):

ph(w) =p1(w)p2(l) (Heim gewinnt und Auswärts verliert)
ph(w) =p1(w)(1-p2(w)) (Heim gewinnt und Auswärts gewinnt nicht)
ph(w) =p1(w)(1-p2(w))(1-p1(d))(1-p2(d)) (Heim gewinnt und
Auswärts gewinnt nicht und Heim und Auswärts spielen beide nicht
unentschieden)
etc.
Müssen die Ergebnisse von oben evtl. noch ODER verknüpft werden?

Anderer Ansatz für ph(w) (Heimmannschaft spielt gegen Auswärtsmann-
schaft und gewinnt) durch ODER-Verknüpfung (Addition) von:
p1(w) (Heim gewinnt)
(1-p1(d)) (Heim spielt nicht unentschieden)
(1-p1(l)) (Heim verliert nicht)
(1-p2(w)) (Auswärts gewinnt nicht)
(1-p2(d)) (Auswärts spielt nicht unentschieden)
p2(l) (Auswärts verliert)
Analoge Ansätze für pa(w) (Auswärts gewinnt) bzw. für px(d) (Spiel
geht unentschieden aus).

Die Summe aus p1(w),p2(l) und px(d) müsste auf jeden Fall bis auf
eventuelle Rundungsfehler "1" ergeben, wenn alle möglichen Ergebnis-
varianten berücksichtigt sind, was bisher nicht mit akzeptabler
Genauigkeit funktioniert hat.

Die Kehrwerte von p1(w),p2(l) und px(d) sind übrigens mögliche
Wettquoten. Allerdings gibt es im Vergleich mit realen Spielen
und Quoten teilweise erhebliche Abweichungen, die nicht durch die
in kommerziellen Quoten enthaltenen Gewinnmargen erklärbar sind.

An dieser Stelle haben mein Kumpel und ich uns festgefahren. Wäre
schön, wenn Ihr uns mit ein paar Hinweisen helfen könntet. Eure
Diskussion "Wahrscheinlichkeit Gewinn eines Fußballteams", April
2021, hat uns nicht recht weitergebracht.

Schon mal vielen Dank
Dieter

Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."
Online-Nachhilfe in Mathematik
Antwort
KL700

KL700 aktiv_icon

07:55 Uhr, 12.05.2023

Antworten
Ich halte solche Überlegung für die Praxis für wenig sinnvoll, weil

a) die Tagesform eine große Rolle spielt

b) psychologische Faktoren im Spiel sind (Angstgegner)

c) die Mannschaften sich von Jahr zu Jahr ändern

d) Überraschungen immer möglich sind

e) auch das Wetter eine Rolle spielt
u.v.m.

Im Toto wirst du deine Chancen damit nicht erhöhen, eher den Frust vergrößern.
Mehr oder wenige hohen WKTen reichen nicht aus für ein Geschäftsmodell.


Du beste WKT-Rechnung kann die Zukunft nicht voraussagen,
sonst gäbe es noch viel mehr Reiche mit leistungslosem Einkommen,
wenn man solche Spielereien nicht als anständige Arbeit betrachtet,
was sie m.E. auch nicht ist.
Alle wollen schnell reich werden mit möglichst geringen Aufwand.
Das funktioniert statistisch sehr selten.

PS:
Im Lotto gab es gestern 2 Volltreffer a6,8 Millionen, habe ich zufällig gelesen.
Chance 1 zu 140 Mio, was nicht Null ist, aber fast 0 für jeden realistisch Denkenden.
Beim Toto ist sie höher: 1313=1 zu ca. 1,6 Mio.
Ein Treffer weniger und der relativ zum Lotto kleine Gewinn bricht enorm ein.


Antwort
HAL9000

HAL9000

08:50 Uhr, 12.05.2023

Antworten
Ich sehe es ähnlich wie KL700: Wo man hinblickt in so einem Ligabetríeb, erkennt man eher Abhängigkeiten denn Unabhängigkeiten.

Zum einen auf einzelne Mannschaften bezogen, sind immer wieder Wellen (meist mehrere Wochen lang) von Formhochs und -tiefs zu beobachten, seien sie nun zurückzuführen auf Verletzungen bzw. eben Rückkehr gesundeter Spieler, psychologische Faktoren, Unruhe im Verein usw.

Aber auch zwischen den Mannschaften gibt es Wechselbeziehungen, sei es nun aufgrund irgendwelcher bestehender Animositäten (Schalke-Dortmund) oder weil sie jeweils auf die Tabellensituation schauen: Spielen z.B. am letzten Spieltag zwei Mannschaften gegeneinander, denen BEIDE ein Remis was bringen würde, dann wird auch entsprechend gespielt - auch wenn das alle leugnen.

Ich denke, sämtliche einfachen Modelle (wie das oben) sind nicht sonderlich gut. Das ist vielleicht wirklich ein Fall für die in letzter Zeit vieldiskutierte KI: Wenn man die entsprechend reichhaltig füttert nicht nur mit der Performance der Mannschaften in der Vergangenheit, sondern richtig "fett" mit allen möglichen greifbaren Daten zu den Spielern, Trainern, dann lässt sich vermutlich schon was besseres kreieren. Es würde mich nicht wundern, wenn sowas bereits passiert bei den Wettanbietern zur Erstellung der a-priori-Wettquoten auch mit genutzt wird - die Quoten werden natürlich später entsprechend der platzierten Wetteinsätze angepasst.


Antwort
HAL9000

HAL9000

08:50 Uhr, 12.05.2023

Antworten
Ich sehe es ähnlich wie KL700: Wo man hinblickt in so einem Ligabetríeb, erkennt man eher Abhängigkeiten denn Unabhängigkeiten.

Zum einen auf einzelne Mannschaften bezogen, sind immer wieder Wellen (meist mehrere Wochen lang) von Formhochs und -tiefs zu beobachten, seien sie nun zurückzuführen auf Verletzungen bzw. eben Rückkehr gesundeter Spieler, psychologische Faktoren, Unruhe im Verein usw.

Aber auch zwischen den Mannschaften gibt es Wechselbeziehungen, sei es nun aufgrund irgendwelcher bestehender Animositäten (Schalke-Dortmund) oder weil sie jeweils auf die Tabellensituation schauen: Spielen z.B. am letzten Spieltag zwei Mannschaften gegeneinander, denen BEIDE ein Remis was bringen würde, dann wird auch entsprechend gespielt - auch wenn das alle leugnen.

Ich denke, sämtliche einfachen Modelle (wie das oben) sind nicht sonderlich gut. Das ist vielleicht wirklich ein Fall für die in letzter Zeit vieldiskutierte KI: Wenn man die entsprechend reichhaltig füttert nicht nur mit der Performance der Mannschaften in der Vergangenheit, sondern richtig "fett" mit allen möglichen greifbaren Daten zu den Spielern, Trainern, dann lässt sich vermutlich schon was besseres kreieren. Es würde mich nicht wundern, wenn sowas bereits passiert bei den Wettanbietern zur Erstellung der a-priori-Wettquoten auch mit genutzt wird - die Quoten werden natürlich später entsprechend der platzierten Wetteinsätze angepasst.


Antwort
KL700

KL700 aktiv_icon

09:33 Uhr, 12.05.2023

Antworten
Hier steht etwas darüber, wie die Quoten entstehen:


www.forschung-und-wissen.de/nachrichten/sonstiges/wie-entstehen-wettquoten-13372646
DieterKruesemann

DieterKruesemann aktiv_icon

13:35 Uhr, 12.05.2023

Antworten
Vielen Dank, KL700 und HAL9000,

uns geht es darum, zunächst die Zahlen für die Wahrscheinlichkeiten für "Heim gewinnt", "Unentschieden" und "Auswärts gewinnt" aus den bis zum Spieltag zur Verfügung stehenden Daten aus den offiziellen Fußballtabellen rein mathematisch zu gewinnen.

Dagegen stehen die Quoten aus Portalen, die Durchschnittswerte mehrerer Wettanbieter zur Verfügung stellen. Hierin sind allerdings noch die Gewinnmargen der Wettanbieter enthalten, was sich aber mathematisch einfach bereinigen lässt, und die Kehrwerte dieser Daten bilden dann die Wahrscheinlichkeiten der oben genannten Ereignisse einschließlich äußerer Einflüsse.

Gerade diese Abweichungen sind für uns interessant. Die Ursachen dieser Abweichungen werden sich zu großen Teilen systematisieren lassen, und daraus könnten empirisch Korrelationen zu den übrigen (insbsondere historischen) Tabellenwerten abgeleitet werden.

In einigen Fällen führte ein finetuning "aus dem Bauch" der offiziellen Quoten mit Hilfe angenommener Korrelationen tatsächlich zu einer Verbesserung der Vorhersage nicht nur für einen Spieltag (das kann man "hinrechnen"), sondern für die gesamte Saison davor und auch für weiter davor liegende Saisons.

Mit diesem Hintergrund gewinnt die "stur" mathematische Herleitung der oben genannten Wahrscheinlichkeiten Sinn. Allerdings fehlt uns noch die statistisch saubere Methode ...

Beste Grüße
Dieter und "Kumpel"
DieterKruesemann

DieterKruesemann aktiv_icon

13:38 Uhr, 12.05.2023

Antworten
Vielen Dank, HAL 9000,

meine Antwort siehe KL700.

Grüße
Dieter
DieterKruesemann

DieterKruesemann aktiv_icon

21:38 Uhr, 14.05.2023

Antworten
Moin HAL9000,

erst einmal danke für Deine Antwort.

Mir geht es tatsächlich um ein streng mathematisches und plausibles Modell zur Berechnung der Wahrscheinlichkeiten für: "Heim gewinnt", "unentschieden" und "Auswärts gewinnt" für ein definiertes Spiel. Verfügbar sind jeweils pro Mannschaft die Anzahlen der bisher gewonnenen (g), unentschiedenen (u) und verlorenen (v) Spiele der Saison. Dabei sollen "Nebeneffekte" wie Tagesform, Verletztenliste, Wetter etc. bewusst außen vor bleiben.

Sinn und Zweck dieser zunächst seltsam erscheinenden Frage ist der Vergleich zwischen diesem rein mathematischen Modell und meinem recht gut funktionierenden halbempirischen Modell, das zahlenmäßig erfassbare Zusatzdaten mit verarbeitet. Das "nackte" mathematische Modell soll nur als Referenz beim benchmarking meiner halbempirischen Ansätze dienen.

Aus den je drei Zahlen für Heim- (h) und Auswärtsmannschaft (a) lassen sich diese durchschnittlichen Wahrscheinlichkeiten für "gewonnen" (g), "unentschieden" (u) und "verloren" (v) berechnen:

ph(g), ph(u), ph(v) bzw. pa(g), pa(u), pa(v)

Die Wahrscheinlichkeiten, dass die jeweiligen Ereignisse nicht eintreten, sind dann:
1-ph(g), 1-ph(u), 1-ph(v) bzw. 1-pa(g), 1-pa(u), 1-pa(v)

In dieser Form sind die Daten für "Heim" von denen für "Auswärts" voneinander unabhängig.

Gesucht ist eine Verknüpfung dieser unabhängigen Daten miteinander, damit sich für das aktuelle Spiel die Wahrscheinlichkeiten für den Sieg von Heim- (1) bzw. Auswärtsmannschaft (2) bzw. einen unentschiedenen Ausgang (X) ergeben. Die Kehrwerte dieser Zahlen entsprechen dann den Quoten für dieses Spiel ohne finetuning, Betriebskostenanteile und Gewinnmargen von Wettveranstaltern.

Die Summe der sich aus den Verknüpfungen ergebenden Wahrscheinlichkeiten p(1),p(X),p(2) muss 1 sein. Das kann aber nur gelingen, wenn z.B. in die Berechnung von p(1) evtl. auch eingeht, mit welcher Wahrscheinlichkeit "Auswärts" verliert (pa(v)), mit welchen Wahrscheinlichkeiten nicht "unentschieden" gespielt wird (1-ph(u)), (1-pa(u)) etc.

An dieser Stelle fehlt mir der Weg zu einer logisch richtigen Verknüpfung der Teilwahrscheinlichkeiten mit "UND" entsprechend "*" bzw. "ODER" entsprechend "+". Evtl. müssen p(1),p(X) und p(2) noch mit einem Faktor "normiert" werden, damit die Summe "1" ergibt.

Hast Du eine Idee für einen plausiblen Ansatz?

Danke
Dieter
Antwort
HAL9000

HAL9000

11:29 Uhr, 15.05.2023

Antworten
Nein, das möchte ich nicht. Ich hab nicht umsonst die KI ins Spiel gebracht, weil ich sämtliche einfachen Ansätze für unzureichend halte. Daher verbrenne ich mir nicht die Finger, indem ich einem dieser einfachen Ansätze meinen Segen gebe. :-)
DieterKruesemann

DieterKruesemann aktiv_icon

13:19 Uhr, 15.05.2023

Antworten
Moin,

wenn ich meine Aufgabenstellung richtig verstanden habe und davon absehe, dass es um Fußball geht, handelt es sich um zwei Objekte, die in der Vergangenheit nach identischen Regeln mit anderen gleich strukturierten Objekten interagiert haben.

Die beiden Objekte haben je Interaktion genau drei Optionen für das Ergebnis der Interaktion. Nach einer bestimmten Anzahl von Interaktionen stehen für jedes Objekt Zahlen zur Verfügung, wie oft die einzelnen Optionen (Ereignisse) eingetroffen sind, woraus sich eindeutig durchschnittliche Wahrscheinlichkeiten berechnen lassen.

Jetzt sollen diese beiden Objekte nach denselben Regeln miteinander interagieren mit wieder drei Optionen für das Ergebnis. Allein aus Vernunftgründen muss angenommen werden, dass die durchschnittlichen Wahrscheinlichkeiten von oben mit den Eintrittswahrscheinlichkeiten für diese Interaktion korreliert sind.

Dies ist die Struktur der Aufgabenstellung, die es auch in anderen Bereichen außerhalb des Fußballs geben sollte. Möglicherweise ist die in der Ökonomie beim merging von Unternehmen aus demselben Marktsegment wiederzufinden. Werde da mal nachschauen.

Wenn ich da was zur Lösung gefunden habe, werde ich mich hier noch einmal melden, falls das in meinem selbstoptimierenden Algorithmus erfolgreich sein sollte.

Erst einmal vielen Dank
Dieter
Frage beantwortet
DieterKruesemann

DieterKruesemann aktiv_icon

13:01 Uhr, 18.05.2023

Antworten
Moin HAL9000,

erfolgreich gelöst durch eine modifizierte Version des Satzes von Bayes.

Grüße
Dieter