![]() |
---|
Guten Abend, mein Kumpel und ich diskutieren schon seit mehreren Tagen, wann statistische Daten voneinander abhängig sind oder nicht und was das bedeutet, wenn die Daten miteinamder verknüpft werden sollen. Konkret geht es um Fußballtabellen, die für jeden Spieltag je Mannschaft darstellen, getrennt nach Heim- und Auswärtsspielen, wieviele Spiele gewonnen bzw. verloren wurden und unentschieden ausgingen, weiterhin erscheinen die Summen über die erzielten und kassierten Tore. Erste Frage: sind die Heim- und Auswärtstabellen statistisch voneinander abhängig, weil sie die Ergebnisse ein und derselben Liga darstellen oder sind die Tabellen voneinander unabhängig, weil die Torchancen beider Mannschaften in der Regel verschieden sind (Heim- bzw. Auswärtsstärke)? Aus den Tabellen ergeben sich für die bisherigen Spieltage die durchschnittlichen Werte für pro Tag gewonnene, verlorene und unentschiedene Spiele und die durchschnittlich erzielten bzw. kassierten Tore. Weiterhin lassen sich damit für den jeweiligen Tag die durchschnittlichen Wahrscheinlichkeiten für gewonnene, verlorene und unentschiedene Spiele ableiten. Je nach Ergebnis der ersten Frage die zweite Frage: Wie sind die Tabellenwerte zu verknüpfen, damit sich die Wahrscheinlichkeiten für den Gewinn der Heim- oder Auswärtsmannschaft bzw. für ein unentschiedenes Spiel ergeben? Verfügbare Wahrscheinlichkeitswerte für: Heimmannschaft (Index Heim gewinnt (won) Heim spielt unentschieden (draw) Heim verliert (lost) Auswärtsmannschaft mit Index ansonsten analog Heimmannschaft. Beispiele für mögliche Verknüpfungen für das aktuelle Spiel zur Ermittlung der Wahrscheinlichkeit, dass "Heim" gewinnt (Index ph(w) (Heim gewinnt und Auswärts verliert) ph(w) (Heim gewinnt und Auswärts gewinnt nicht) ph(w) (Heim gewinnt und Auswärts gewinnt nicht und Heim und Auswärts spielen beide nicht unentschieden) etc. Müssen die Ergebnisse von oben evtl. noch ODER verknüpft werden? Anderer Ansatz für ph(w) (Heimmannschaft spielt gegen Auswärtsmann- schaft und gewinnt) durch ODER-Verknüpfung (Addition) von: (Heim gewinnt) (Heim spielt nicht unentschieden) (Heim verliert nicht) (Auswärts gewinnt nicht) (Auswärts spielt nicht unentschieden) (Auswärts verliert) Analoge Ansätze für pa(w) (Auswärts gewinnt) bzw. für px(d) (Spiel geht unentschieden aus). Die Summe aus und px(d) müsste auf jeden Fall bis auf eventuelle Rundungsfehler "1" ergeben, wenn alle möglichen Ergebnis- varianten berücksichtigt sind, was bisher nicht mit akzeptabler Genauigkeit funktioniert hat. Die Kehrwerte von und px(d) sind übrigens mögliche Wettquoten. Allerdings gibt es im Vergleich mit realen Spielen und Quoten teilweise erhebliche Abweichungen, die nicht durch die in kommerziellen Quoten enthaltenen Gewinnmargen erklärbar sind. An dieser Stelle haben mein Kumpel und ich uns festgefahren. Wäre schön, wenn Ihr uns mit ein paar Hinweisen helfen könntet. Eure Diskussion "Wahrscheinlichkeit Gewinn eines Fußballteams", April hat uns nicht recht weitergebracht. Schon mal vielen Dank Dieter Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |
![]() |
![]() |
Ich halte solche Überlegung für die Praxis für wenig sinnvoll, weil die Tagesform eine große Rolle spielt psychologische Faktoren im Spiel sind (Angstgegner) die Mannschaften sich von Jahr zu Jahr ändern Überraschungen immer möglich sind auch das Wetter eine Rolle spielt . Im Toto wirst du deine Chancen damit nicht erhöhen, eher den Frust vergrößern. Mehr oder wenige hohen WKTen reichen nicht aus für ein Geschäftsmodell. Du beste WKT-Rechnung kann die Zukunft nicht voraussagen, sonst gäbe es noch viel mehr Reiche mit leistungslosem Einkommen, wenn man solche Spielereien nicht als anständige Arbeit betrachtet, was sie . auch nicht ist. Alle wollen schnell reich werden mit möglichst geringen Aufwand. Das funktioniert statistisch sehr selten. PS: Im Lotto gab es gestern 2 Volltreffer Millionen, habe ich zufällig gelesen. Chance 1 zu Mio, was nicht Null ist, aber fast 0 für jeden realistisch Denkenden. Beim Toto ist sie höher: zu ca. Mio. Ein Treffer weniger und der relativ zum Lotto kleine Gewinn bricht enorm ein. |
![]() |
Ich sehe es ähnlich wie KL700: Wo man hinblickt in so einem Ligabetríeb, erkennt man eher Abhängigkeiten denn Unabhängigkeiten. Zum einen auf einzelne Mannschaften bezogen, sind immer wieder Wellen (meist mehrere Wochen lang) von Formhochs und -tiefs zu beobachten, seien sie nun zurückzuführen auf Verletzungen bzw. eben Rückkehr gesundeter Spieler, psychologische Faktoren, Unruhe im Verein usw. Aber auch zwischen den Mannschaften gibt es Wechselbeziehungen, sei es nun aufgrund irgendwelcher bestehender Animositäten (Schalke-Dortmund) oder weil sie jeweils auf die Tabellensituation schauen: Spielen z.B. am letzten Spieltag zwei Mannschaften gegeneinander, denen BEIDE ein Remis was bringen würde, dann wird auch entsprechend gespielt - auch wenn das alle leugnen. Ich denke, sämtliche einfachen Modelle (wie das oben) sind nicht sonderlich gut. Das ist vielleicht wirklich ein Fall für die in letzter Zeit vieldiskutierte KI: Wenn man die entsprechend reichhaltig füttert nicht nur mit der Performance der Mannschaften in der Vergangenheit, sondern richtig "fett" mit allen möglichen greifbaren Daten zu den Spielern, Trainern, dann lässt sich vermutlich schon was besseres kreieren. Es würde mich nicht wundern, wenn sowas bereits passiert bei den Wettanbietern zur Erstellung der a-priori-Wettquoten auch mit genutzt wird - die Quoten werden natürlich später entsprechend der platzierten Wetteinsätze angepasst. |
![]() |
Ich sehe es ähnlich wie KL700: Wo man hinblickt in so einem Ligabetríeb, erkennt man eher Abhängigkeiten denn Unabhängigkeiten. Zum einen auf einzelne Mannschaften bezogen, sind immer wieder Wellen (meist mehrere Wochen lang) von Formhochs und -tiefs zu beobachten, seien sie nun zurückzuführen auf Verletzungen bzw. eben Rückkehr gesundeter Spieler, psychologische Faktoren, Unruhe im Verein usw. Aber auch zwischen den Mannschaften gibt es Wechselbeziehungen, sei es nun aufgrund irgendwelcher bestehender Animositäten (Schalke-Dortmund) oder weil sie jeweils auf die Tabellensituation schauen: Spielen z.B. am letzten Spieltag zwei Mannschaften gegeneinander, denen BEIDE ein Remis was bringen würde, dann wird auch entsprechend gespielt - auch wenn das alle leugnen. Ich denke, sämtliche einfachen Modelle (wie das oben) sind nicht sonderlich gut. Das ist vielleicht wirklich ein Fall für die in letzter Zeit vieldiskutierte KI: Wenn man die entsprechend reichhaltig füttert nicht nur mit der Performance der Mannschaften in der Vergangenheit, sondern richtig "fett" mit allen möglichen greifbaren Daten zu den Spielern, Trainern, dann lässt sich vermutlich schon was besseres kreieren. Es würde mich nicht wundern, wenn sowas bereits passiert bei den Wettanbietern zur Erstellung der a-priori-Wettquoten auch mit genutzt wird - die Quoten werden natürlich später entsprechend der platzierten Wetteinsätze angepasst. |
![]() |
Hier steht etwas darüber, wie die Quoten entstehen: www.forschung-und-wissen.de/nachrichten/sonstiges/wie-entstehen-wettquoten-13372646 |
![]() |
Vielen Dank, KL700 und HAL9000, uns geht es darum, zunächst die Zahlen für die Wahrscheinlichkeiten für "Heim gewinnt", "Unentschieden" und "Auswärts gewinnt" aus den bis zum Spieltag zur Verfügung stehenden Daten aus den offiziellen Fußballtabellen rein mathematisch zu gewinnen. Dagegen stehen die Quoten aus Portalen, die Durchschnittswerte mehrerer Wettanbieter zur Verfügung stellen. Hierin sind allerdings noch die Gewinnmargen der Wettanbieter enthalten, was sich aber mathematisch einfach bereinigen lässt, und die Kehrwerte dieser Daten bilden dann die Wahrscheinlichkeiten der oben genannten Ereignisse einschließlich äußerer Einflüsse. Gerade diese Abweichungen sind für uns interessant. Die Ursachen dieser Abweichungen werden sich zu großen Teilen systematisieren lassen, und daraus könnten empirisch Korrelationen zu den übrigen (insbsondere historischen) Tabellenwerten abgeleitet werden. In einigen Fällen führte ein finetuning "aus dem Bauch" der offiziellen Quoten mit Hilfe angenommener Korrelationen tatsächlich zu einer Verbesserung der Vorhersage nicht nur für einen Spieltag (das kann man "hinrechnen"), sondern für die gesamte Saison davor und auch für weiter davor liegende Saisons. Mit diesem Hintergrund gewinnt die "stur" mathematische Herleitung der oben genannten Wahrscheinlichkeiten Sinn. Allerdings fehlt uns noch die statistisch saubere Methode . Beste Grüße Dieter und "Kumpel" |
![]() |
Vielen Dank, HAL meine Antwort siehe KL700. Grüße Dieter |
![]() |
Moin HAL9000, erst einmal danke für Deine Antwort. Mir geht es tatsächlich um ein streng mathematisches und plausibles Modell zur Berechnung der Wahrscheinlichkeiten für: "Heim gewinnt", "unentschieden" und "Auswärts gewinnt" für ein definiertes Spiel. Verfügbar sind jeweils pro Mannschaft die Anzahlen der bisher gewonnenen unentschiedenen und verlorenen Spiele der Saison. Dabei sollen "Nebeneffekte" wie Tagesform, Verletztenliste, Wetter etc. bewusst außen vor bleiben. Sinn und Zweck dieser zunächst seltsam erscheinenden Frage ist der Vergleich zwischen diesem rein mathematischen Modell und meinem recht gut funktionierenden halbempirischen Modell, das zahlenmäßig erfassbare Zusatzdaten mit verarbeitet. Das "nackte" mathematische Modell soll nur als Referenz beim benchmarking meiner halbempirischen Ansätze dienen. Aus den je drei Zahlen für Heim- und Auswärtsmannschaft lassen sich diese durchschnittlichen Wahrscheinlichkeiten für "gewonnen" "unentschieden" und "verloren" berechnen: ph(g), ph(u), ph(v) bzw. pa(g), pa(u), pa(v) Die Wahrscheinlichkeiten, dass die jeweiligen Ereignisse nicht eintreten, sind dann: 1-ph(g), 1-ph(u), 1-ph(v) bzw. 1-pa(g), 1-pa(u), 1-pa(v) In dieser Form sind die Daten für "Heim" von denen für "Auswärts" voneinander unabhängig. Gesucht ist eine Verknüpfung dieser unabhängigen Daten miteinander, damit sich für das aktuelle Spiel die Wahrscheinlichkeiten für den Sieg von Heim- bzw. Auswärtsmannschaft bzw. einen unentschiedenen Ausgang ergeben. Die Kehrwerte dieser Zahlen entsprechen dann den Quoten für dieses Spiel ohne finetuning, Betriebskostenanteile und Gewinnmargen von Wettveranstaltern. Die Summe der sich aus den Verknüpfungen ergebenden Wahrscheinlichkeiten muss 1 sein. Das kann aber nur gelingen, wenn . in die Berechnung von evtl. auch eingeht, mit welcher Wahrscheinlichkeit "Auswärts" verliert (pa(v)), mit welchen Wahrscheinlichkeiten nicht "unentschieden" gespielt wird (1-ph(u)), (1-pa(u)) etc. An dieser Stelle fehlt mir der Weg zu einer logisch richtigen Verknüpfung der Teilwahrscheinlichkeiten mit "UND" entsprechend "*" bzw. "ODER" entsprechend "+". Evtl. müssen und noch mit einem Faktor "normiert" werden, damit die Summe "1" ergibt. Hast Du eine Idee für einen plausiblen Ansatz? Danke Dieter |
![]() |
Nein, das möchte ich nicht. Ich hab nicht umsonst die KI ins Spiel gebracht, weil ich sämtliche einfachen Ansätze für unzureichend halte. Daher verbrenne ich mir nicht die Finger, indem ich einem dieser einfachen Ansätze meinen Segen gebe. :-) |
![]() |
Moin, wenn ich meine Aufgabenstellung richtig verstanden habe und davon absehe, dass es um Fußball geht, handelt es sich um zwei Objekte, die in der Vergangenheit nach identischen Regeln mit anderen gleich strukturierten Objekten interagiert haben. Die beiden Objekte haben je Interaktion genau drei Optionen für das Ergebnis der Interaktion. Nach einer bestimmten Anzahl von Interaktionen stehen für jedes Objekt Zahlen zur Verfügung, wie oft die einzelnen Optionen (Ereignisse) eingetroffen sind, woraus sich eindeutig durchschnittliche Wahrscheinlichkeiten berechnen lassen. Jetzt sollen diese beiden Objekte nach denselben Regeln miteinander interagieren mit wieder drei Optionen für das Ergebnis. Allein aus Vernunftgründen muss angenommen werden, dass die durchschnittlichen Wahrscheinlichkeiten von oben mit den Eintrittswahrscheinlichkeiten für diese Interaktion korreliert sind. Dies ist die Struktur der Aufgabenstellung, die es auch in anderen Bereichen außerhalb des Fußballs geben sollte. Möglicherweise ist die in der Ökonomie beim merging von Unternehmen aus demselben Marktsegment wiederzufinden. Werde da mal nachschauen. Wenn ich da was zur Lösung gefunden habe, werde ich mich hier noch einmal melden, falls das in meinem selbstoptimierenden Algorithmus erfolgreich sein sollte. Erst einmal vielen Dank Dieter |
![]() |
Moin HAL9000, erfolgreich gelöst durch eine modifizierte Version des Satzes von Bayes. Grüße Dieter |