|
Ich hänge jetzt schon sehr lange an einer Aufgabe fest und finde im Internet keine zufriedenstellende Antwort und habe die Hoffnung, dass mir hier jemand weiterhelfen kann...
Bei meiner Aufgabe handelt es sich um zwei Datensätze, für die ich den Korrelationskoeffizienten berechnen soll und anschließend Bestimmtheitsmaß und korrigiertes Bestimmtheitsmaß bestimmen soll...
Ich habe auch fast alles geschafft, hänge jetzt aber an dem blöden korrigierten Bestimmtheitsmaß weil ich nicht verstehe, wie genau ich es berechne...
In meiner Formelsammlung steht nur: "Anzahl der gefitteten Datenpunkte" und "Anzahl der Fitparameter", mit diesen Begriffen kann ich aber nichts anfangen.
Wer kann mir helfen???
Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |
|
anonymous
12:40 Uhr, 08.07.2018
|
Anzahl der gefitteten Datenpunkte: Die Anzahl der Datenpunkte die du bei der regression benutzt hast.
Anzahl der Fitparameter: Hier versuchst du Variable Gewicht mithilfe der variable alter zu erklären du nutzt also 1 Fitparamter (Kovariable).
Die regression ist ja nicht nur auf eine Kovariable beschränkt. Man könnte auch noch andere variablen benutzen: . das Einkommen der eltern.
Das kommst du auf Gewicht kg] Alter Jahre] Monats Einkommen 1000€]
Nun hättest du zwei Kovariabeln: (Alter und einkommen der Eltern) also wäre hier
Motivation des korrigierten Bestimmtheitsmaß: Nimmt man immer mehr Kovariabeln zur regression hinzu, dann wird immer gößer. Egal wie Sinnlos die Variable ist. Du könntest hier . die Anzahl der Tore der letzten 8 WM Tage nutzen und trotzdem würde sich "verbessern". Wenn du also auf der Suche nach dem besten Modell bist, dann nützt nicht viel. Im allgemeinen würden immer Modelle mit vielen Kovariablen bevorzugt werden. Daher versucht man in abhängigkeit von der anzahl der Kovariabeln zu verringern. Nimmt man nun mehr Kovariabeln zum Modell hinzu, die wirklich "nützlich" sind dann erhöht sich das korr . Nimmt aber Kovariabeln wie . die Anzahl der WM Tore dann wird sich das korr. verrigern. SO erhofft man sich, dass das beste Modell das mit dem höchsten korr ist.
|
|
Danke Zombe,
das hilft mir auf jeden Fall schonmal weiter und bringt ein bisschen Licht ins dunkle :-D)
Wenn ich das richtig verstehe sind dann meine gefitteten Datenpunkte in meinem Fall nDP=8 und die Variable Fitparameter nFP=1, oder?
Wenn ich das jetzt in die Formel einsetzte bekomme ich:
. =(gerundet)
Doch warum steht in der Musterlösung dann 0,9832?? Was mache ich falsch?
|
anonymous
18:43 Uhr, 08.07.2018
|
Du machst nichts falsch, sondern die Lösung. Dort wurde die Formel mit benutzt. Das enspricht der gesamt anzahl der parameter deines Models: Einmal die Konstante und als zweites der einfluss des alters. Nur gilt die Formel der Formelsammlung für die Anzahl ohne diese konstante. Hier also nur 1 und nicht zwei.
EDIT: ok doch nicht. Bei kommt raus. dann weiß ich auch nicht was bei der Lösung passiert ist :-) Dein ergebnis passt aber trotzdem.
|
|
Ok super, dann hat sich mein Problem gelöst.. Danke Zombe!! :-)
|