Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Zweiseitiger Signifikanztest mit Intervallwkt.

Zweiseitiger Signifikanztest mit Intervallwkt.

Schüler

Tags: signifikanztest, Stochastik

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
Sabine2

Sabine2 aktiv_icon

18:11 Uhr, 14.01.2013

Antworten
Hallo liebe Mathematiker!

Ich werde gleich eine Aufgabe vorstellen und meine Lösung dazu aufschreiben. Die Fragen (ja, Plural) dazu, schreibe ich dann an die jeweilige Stelle in meiner Lösung.

Aufgabe: Wir haben einen Bürgermeister, der von 55% der Bevölkerung gewählt worden ist. Er möchte wissen, ob er im kommenden Wahlvorgang mit einem identischen Ausgang rechnen kann. Dazu werden 750 Personen befragt, das Signifikanzniveau α soll bei 6,5% liegen.

Lösung:
H0: Die Wählergunst hat sich verändert. p0,55
H0.1: Die Gunst hat sich zum Positiven geändert. p>0,55
H0.2: Die Gunst hat sich zum Negativen geändert. p<0,55

H0.1i:p=0,55
H0.2i:p=0,55

Das war das, was wir im Unterricht noch zusammen gemacht haben. Es wurde bis hierhin die Nullhypothese konkreter formuliert und die beiden letzen Schritte verdeutlichen, dass in beiden Fällen mit p=0,55 gerechnet wird. Mit welcher Begründung kann man das rechtfertigen? Die 0,55 sind ja eigentlich nicht in der Hypothese p0,55 enthalten.

Ich mache dann mal weiter:
X: Anzahl der Personen unter den 750, die angeben, den Bürgermeister wiederzuwählen. X ist binomialverteilt mit n=750 und p=0,55.

H0 wird nur dann abgelehnt, wenn ungefähr μ=7500,55=412,5 Befragte angeben, den Bürgermeister wiederzuwählen.

Dann habe ich mir eine Skizze gezeichnet. Ein zu μ symmetrisches Gebiet der Glockenkurve hat 6,5% des Flächeninhalts der Glocke von - bis +. Der Annahmebereich teilt sich also in zwei Intervalle auf, beide haben eine Wahrscheinlichkeit von 46,75%. Da die 6,5% ein Maximalwert sind, sind die 46,75% ein Minimalwert. kl sei nun die linke und kr die rechte Grenze des Verwerfungsbereiches.
Es muss dann gelten:

P(X<kl)0,4675
P(X>kr)0,4675

Dass es 0,4675 sein muss, ist für mich klar und auch richtig, glaube ich. Ist aber das < und > richtig, oder muss es und sein? kl und kr sind doch wegen < und > in meinem Verwerfungsbereich (was ja auch so sein soll), würde ich und nehmen, wären sie im Annahmebereich, richtig?

Die Laplace-Bedingung ist wegen σ2=185,625>9 erfüllt, also kann X als näherungsweise normalverteilt angesehen werden.

Ich komme dann auf kl411,91 und kr413,09. Kann das jemand bestätigen?

Somit erhalte ich den Ablehnungsbereich [412;413].

Irgendwie kommt der mir ziemlich klein vor. Was mich aber am meisten an dieser Aufgabe stört, ist, dass ich mit p=0,55 gerechnet habe, obwohl das garnicht zu H0 gehört.

Danke für die Beantwortung meiner Fragen!

Sabine

Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."
Hierzu passend bei OnlineMathe:

Online-Übungen (Übungsaufgaben) bei unterricht.de:
 
Online-Nachhilfe in Mathematik
Antwort
prodomo

prodomo aktiv_icon

09:49 Uhr, 15.01.2013

Antworten
Gegenfrage: mit welchem p würdest du denn sonst die Verteilung ansetzen? Die 0,55 sind doch die einzige konkrete Angabe. Nicht das p ist wichtig, sondern die Interpretation der Ergebnisse.

Ich meine, dass du das Signifikanzniveau falsch interpretiert hast. Bei einer so kleinen Zahl kann es eigentlich nur bedeuten, dass man einen maximalen Fehler von 6,5% für die anstehende Entscheidung zugesteht und nicht, dass man sich zu 6,5% sicher sein will. Leider gehen bei vielen Aufgaben die Bedeutungen von "Signifikanzniveau" auseinander. Es ist hilfreich, dass "signifikant" soviel wie "deutlich" heißt. Das Gegenteil wäre hier "zufällig".
Gleich 3 Hypothesen...Hier wird erschreckend klar, wie man Schülern eine einfache Sache mit viel Formalismen so verwirrend vermittelt, dass selbst gute über ihre eigenen Füße stolpern.
Der Mittelwert wäre 412,5. Die Hypothese "Die Zustimmung ist unverändert" wird abgelehnt, wenn deutlich weniger oder deutlich mehr als die 412,5 erreicht werden. Wegen der 6,5% Toleranz reicht der Annahmebereich von 3,25% bis 96,75% und liegt symmetrisch zu μ. Mit Φ(1,846)=0,9675 folgt für die größte Zahl im Annahmebereich k+0,5-412,5σ<1,846. Das gibt k<437,15.... Also ist 437 das größte zulässige Ergebnis für die Annahme. Entsprechend ist 388 das kleinste zulässige für die Annahme.
Sabine2

Sabine2 aktiv_icon

16:28 Uhr, 15.01.2013

Antworten
Ja mit der von dir gewählten Nullhypothese machen deine Ausführungen sinn, aber ich habe eine andere Nullhypothese. Um den erwartungswert liegt ein symmetrischer Bereich mit 6,5%, der Verwerfungsbereich. Der Annahmebereich splittet sich dann auf. Und daher denke ich auch nicht, dass ich das Signifikanzniveau falsch interpretiert habe.
Antwort
prodomo

prodomo aktiv_icon

16:59 Uhr, 16.01.2013

Antworten
Ja, stimmt. Im Kontext allerdings ist dieser Test eigentlich überflüssig, die Kosten dafür könnte die Partei des Bürgermeisters sparen, denn "unveränderte Zustimmung" wird ja nur bei einer "Punktlandung" angenommen.
Die Abituraufgaben haben in der Regel einseitige Tests und die Hypothesen sind meistens vorgegeben bzw. geht aus dem Text hervor, welche Absicht die Tester haben. Man nimmt dann als Hypothese immer das Gegenteil. Wenn du die Sammlung der Aufgaben von Stark hast, schau mal in die Stochastik vom letzten Jahr, Alkohol im Verkehr.
Sabine2

Sabine2 aktiv_icon

19:46 Uhr, 16.01.2013

Antworten
Die Sammlung habe ich leider nicht.
Danke für die Antwort. Ich meinte im Unterricht schon, dass es in meinen Augen sinnvoller ist, zu überprüfen, ob sich die Stimmzahl geändert hat. Mit einer solchen Aufgabe hätte ich auch weniger Probleme, weil H0 (bzw. p0) dann nicht zusammengesetzt wäre.

Sind denn meine Ergebnisse und erläuterungen aus meiner Fragestellung richtig? Und magst du nochmal auf meine 2-3 In meiner Lösung versteckten Fragen eingehen?

Fragen waren (vereinfacht):
1. Rechtfertigung p0=0,55
2. Zugehörigkeit von kl bzw. kr bei () und <(>)
3. Größe des Ablehnungsbereiches
4. Meine Grundidee lag ja in der von mir beschriebenen Skizze. Kann man das so machen?

Ich hab nochmal das Gegenteil der Nullhypothese als Nullhypothese nachgerechnet. Sprich das, was du zuerst dachtest.
1. P(Xkl)0,0325
2.P(Xkr)0,0325P(Xkr-1)0,9675

Aus 1. folgt dann kl+0,5-μσ-1,85kl386,79
Aus 2. folgt kr-1+0,5-μσ1,85kr438,21

Somit der Ablehnungsbereich [0;386][439;750]. Dieser entscheidet sich ganz minimal von deinem. Wieso? An der besseren Genauigkeit deiner Tabelle (du hast 3 Nachkommastellen) liegt es meiner Meinung nach nicht.

Diese 5 Fragen sind also noch offen.

Antwort
prodomo

prodomo aktiv_icon

07:12 Uhr, 18.01.2013

Antworten
Die Frage nach den 0,55 dürfte sich erledigt haben.

Ich habe die Situation noch einmal als Bild angefügt. kL ist die erste ganze Zahl, die in den Annahmebereich "hineintapst", kR die größte, die noch innerhalb liegt. Da Φ-1(53,25%)=0,0816 ist, ergibt sich kL+0,5-412,57500,550,45>-0,0816 und kR+0,5-412,57500,550,45<0,0816. Daraus folgt kL<410,88... und kR< 413,11...Also ist [411;413] der Annahmebereich bei dieser Entscheidungsregel.
Die Frage, ob es > oder heißen muss, ist oft akademisch, weil ein Schritt von 1 auf der Skala der k's deutlich größeren Schritten innerhalb der %-Skala entspricht, so dass eine genaue Landung mit ganzzahligem k auf einem bestimmten Prozentwert praktisch nie vorkommt. Hier sind 6,5% Niveau gegeben, der Rand gehört also zum Annahmebereich, von daher wäre bei kL zutreffend, was aber dasselbe k ergibt.

Zum Vergleich mit meiner Rechnung: bei kL muss es, egal bei welchem Niveau, immer heißen, bei kR. Das hast du vertauscht und bekommst so um 1 veränderte Werte. Auch hast du kR-1 genommen, was sich in der Definition von meinem kR unterscheidet.

Glocke
Sabine2

Sabine2 aktiv_icon

15:25 Uhr, 18.01.2013

Antworten
Ehrlich gesagt bin ich jetzt nicht wirklich schlauer als vorher.. Okay, die 0,55 sind der einzig angegebene konkrete Wert für p, trotzdem lautet H0:p0,55. Wieso rechne ich also mit p=0,55?

Den ganzen Rest kann ich nicht nachvollziehen. Lies dir doch bitte nochmal meinen ersten Post durch und sage konkret, was an welcher Stelle falsch ist. Achte dabei bitte auch auf die und die < (bzw. die Gegenteile davon). In der Aufgabe wollte ich, dass kl und kr zum ABlehnungsbereich gehören, deswegen habe ich nur mit < und > gearbeitet, weil die Prozentzahl ja den Annahmebereich darstellt. Ich finde es auch merkwürdig, dass dein Ablehnungsbereich assymmetrisch zu μ ist.

Zu deinem Test: Ich möchte auch hier den ABlehnungsbereich festlegen, dann ist es doch aber genau andersrum als von dir gesagt. Ich sehe in meiner Rechnung einfach den Fehler/die Fehler nicht.
Antwort
prodomo

prodomo aktiv_icon

16:33 Uhr, 18.01.2013

Antworten
Ok, letzter Versuch (denn so langsam verwirrt mich das auch).
Wir haben eine Hypothese, die abgelehnt wird, falls das Ergebnis nicht mehr als 6,5% nach oben oder unten vom Mittelwert abweicht. Soweit D'accord.
Jetzt schreibst du:"die linke Grenze des Verwerfungsbereiches sei kl und die rechte k_r".
Eigentlich bezeichnet k eine ganze Zahl, bei deiner Wahl ist es aber eine reelle Zahl, die genau dem Wert 46,75% bzw. 53,25% entspricht. Die Hypothese wird also abgelehnt, wenn das X vom Ergebnis mindestens kl und höchstens kr beträgt und somit in der symmetrischen Mittelzone landet.
Die beiden nächsten Ungleichungen sehen eher seltsam aus, denn es ist nicht klar, ob sie Bedingungen für das X... Jetzt hab ich den Faden verloren, am Schirm ist das sowieso noch schwerer zu verfolgen wegen des kleinen Fensters. Tut mir leid, aber diese Art des Ansatzes mit gleich 3 Hypothesen liegt so weit von meiner üblichen Herangehensweise weg, dass ich mit dem Nachvollzug nicht zurecht komme.
Sabine2

Sabine2 aktiv_icon

18:01 Uhr, 18.01.2013

Antworten
Naja eigentlich ja nicht. Wir lehnen ab, falls das Ergebnis nicht mehr als 3,25% nach oben oder unten von μ abweicht.

Ich bin so langsam auch der Überzeugung, dass diese drei Hypothesen auch nur der
Verwirrung dienen. Eigentlich genügt es, mit H0 zu arbeiten.
Jetzt unterteile ich die Glocke in drei Teile. Von links nach rechts: 46,75%,6,5%,46,75%. Die 6,5% bzw. deren Bereich stellt ja den Ablehnungsbereich dar. Dieser Beträgt HÖCHSTENS 6,5%, demzufolge kann es auch sein, dass die rechten (und linken) 46,75% größer werden, nämlich genau dann, wenn die 6,5% kleiner werden. Soweit klar?
Jetzt möchte ich Grenzen bestimmen, die zwei Eigenschaften haben sollen:
1. Sie sollen die 3 Bereiche nach den oben genannten Prozentzahlen trennen.
2. Sie sollen IM ABLEHNUNGSBEREICH liegen.

Hätte ich nur 1., wäre nicht gewährleistet, dass es natürliche Zahlen sind. Man muss also runden. Wie bzw. in welche Richtung geundet werden soll, gibt 2. vor.

Man bedanke: Der Ablehnungsbereich ist ein zusammenhängendes Intervall, der Annahmebereich ist aufgesplittet.

Man sagt ja immer: P(V)α. Also die Wahrscheinlichkeit für den Verwerfungsbereich soll kleiner oder gleich dem Signifikanzniveau sein. Wenn ich also anstatt P(V)P(Xk) schreibe, ist dieses k Element von V. Schreibe ich P(X<k), so ist k nicht Element von V sondern vom Annahmebereich und zwar eine Grenze von diesem. Ob obere oder untere hängt von der Art der Hypothese ab.

Die ersten 46,75% sind Annahmebereich. In P(Xkl) wäre kl also Element von diesem. Das möchte ich aber nicht, also wähle ich P(X<kl)=P(Xkl-1). So ist mein kl im Ablehnungsbereich. Da die 46,75% ein MINDESTwert sind, ist P(Xkl-1)0,4675. Für uns ist es ja nur recht, wenn die 46,75% überschritten werden, weil dann automatisch die 6,5% unterschritten werden.
Für kr gilt die selbe Begründung und man kommt auf P(X>kr)0,4675.

Kein Mensch sagt übrigens, dass ich Recht habe. Für mich scheint das jedoch alles recht plausibel.

Ich hoffe du meldest dich trotz deiner ersten Bemerkung nochmal! :-)
Sabine
Antwort
prodomo

prodomo aktiv_icon

15:05 Uhr, 19.01.2013

Antworten
Ich habe noch einmal probiert, das Ganze als stetige Verteilung aufzufassen, wie es einer genauen Berechnung der Grenzen, also mit zugelassenen nicht ganzzahligen Werten, auch entspricht. Mit einem CAS lässt sich die Φ- Funktion umkehren. Für einen Mittelwert von 412,5 und eine Varianz von 7500,550,45=185,625 ergibt sich für 0,4675 ein Wert von 411,388..Ich hatte 410,88..Die Differenz ist auf das +0,5 zurückzuführen. Für 0,5325 erhält man 413,611. Jetzt ist aber zu berücksichtigen, dass die Personenzahl ja ganzzahlig ist und jeweils k±0,5 umfasst. Die 413 liegt dann vollkommen im Annahmebereich, die 412 auch. Die 411 liegen nicht komplett im Verwerfungsbereich, weil 411,5>411,388 ist. Insofern reicht der Verwerfungsbereich nur von 410 bis 0. Auf der rechten Seite liegt auch 414 nicht ganz im Verwerfungsbereich, weil 413,5<413,61.. ist. Man sieht, hier stößt die Näherung an ihre Grenzen, weil der mittlere Bereich so klein ist.

Das soll es aber jetzt wirklich sein.
Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.