Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Alternativtest

Alternativtest

Schüler

Tags: alternativtest, Stochastik

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
Sabine2

Sabine2 aktiv_icon

20:51 Uhr, 20.12.2012

Antworten
Hallo,

wir haben heute im Unterricht (ja, wir sind eine der wenigen, die noch unterricht machen :-P)) einen Alternativtest durchgeführt und ich zweifel an dem, was mein Lehrer meinte. Er meint, er habe Recht und ich liege falsch, aber das verstehe ich nicht.

Folgendes:

-man hat 2 Töpfe mit Losen, in ihnen gibt es Preise und Nieten
-1. Topf: 30% Preise
-2. Topf: 10% Preise
-man hat vergessen die Töpfe zu beschriften und will nun testen, ob man den 1. Topf erwischt hat (den benötigt man und nicht den 2.)
-Signifikanzniveau 4,7%

Es muss also versucht werden, die These, dass man den 2. Topf erwischt hat, abzulehnen. H0:p=0,1
X: Anzahl der Preise in einem Topf, wenn man 200 mal zieht. X ist binomialverteilt.
H0 wird nur dann abgelehnt, wenn deutlich mehr als μ=20 Preise gezogen werden.

P(X>k)0,047
So das nähert man dann mit der Normalverteilung an und kommt auf k26,63.
Unser Lehrer meinte nun, dass der Ablehnungsbereich [27;200] lautet. Das würde ja bedeuten, dass das kP(X>k)0,047 noch zum Annahmebereich gehören würde. An dem Punkt habe ich aber widersprochen. Zu unrecht, wie mir dann erwidert wurde. Für mich lautet der Ablehnungsbereich [28;200].
Wer hat Recht?

Und dann noch allgemeine Fragen zum Testen:
Ist das X nicht eigentlich hypergeometrisch verteilt? Also wird eine hypergeometrische Verteilung mit einer Binomialverteilung und die wieder mit einer Normalverteilung angenähert. Ein bisschen zuviel des Guten, oder nicht?

Außerdem verstehe ich nicht, wieso man mit einem Testverfahren eine These begründet ablehnen, aber nicht begründet annehmen kann.

Ich freue mich auf eure Antworten!


Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."
Online-Nachhilfe in Mathematik
Antwort
prodomo

prodomo aktiv_icon

07:16 Uhr, 21.12.2012

Antworten
Da ist entweder im Unterricht oder in deinem Kopf (glaube ich nach den bisherigen Erörterungen aber eher nicht) etwas durcheinander geraten. Schon die Verwendung des Begriffes "Signifikanzniveau" hat bei mir alle Glocken schrillen lassen. Ein Signifikanzniveau ist ja eine willkürlich gesetzte Schwelle, ab der man ein bestimmtes Testergebnis nicht mehr als zufällig eingetreten anerkennen will.
Der Alternativtest (deswegen heißt er ja so) beinhaltet dagegen zwei gleichberechtigte Hypothesen. Deswegen ist es auch im Prinzip egal, welche man als Nullhypothese nimmt.
Es handelt sich zwar prinzipiell um hypergeometrische Verteilung (wie immer bei endlichen Mengen ohne Zurücklegen), aber man geht davon aus, dass die Zahl der Lose sehr groß ist, sodass bei 200 Entnahmen die Chancen praktisch gleich bleiben (sonst wäre die Angabe der Treffer in Prozenten schon unsinnig).
Die Wahrscheinlichkeit, dass man zwischen 0 und 27 Treffer bekommt, ist k=027(200k)0,1k0,9200-k=0,956571500. Bei Verwendung der Normalverteilung als Näherung ergibt sich x=k+12-20200,9=1,675, weil die Tabelle Φ(1,675)=0,9530 liefert. Daraus folgt k=26,06. Demnach liegt bei dieser Näherung die 27 im Gegensatz zur Binomialverteilung schon über der zulässigen Grenze.
Bei Verwendung des in SH zugelassenen nicht grafikfähigen TR Casio 991 ist die Berechnung der exakten Summe in 30 Sekunden erledigt.
Allerdings ist die Vorgabe eines "Signifikanzniveaus" beim Alternativtest unüblich. Gebräuchlich ist "Fehler erster Art" oder "alpha-Fehler". Das Niveau wird unter Berücksichtigung beider Fehler so gewählt, dass der mögliche Gesamtfehler minimal wird. Je kleiner nämlich α wird, desto größer wird β. Zur Veranschaulichung kannst du dir die Histogramme für 0,1 und 0,3 in ein gemeinsames Koordinatensystem zeichnen. Dort, wo die Treppenkurven sich schneiden, liegt die Stelle des minimalen Gesamtfehlers.
Sabine2

Sabine2 aktiv_icon

10:46 Uhr, 21.12.2012

Antworten
Irgendwie verwirrt mich das immer mehr. Also welcher Ablehnungsbereich ist nun richtig?
Und wir haben im Unterricht die Begriffe Signifikanzniveau und α- Fehler gleichgesetzt, was in meinen Augen aber auch keinen Sinn ergeben hat. Das Signifikanzniveau ist ja nur eine obere Schranke für α, die ja aber in 99,99999% der Fälle nicht erfüllt wird. Man kann das also ( meinen Augen) garnicht gleichsetzen.

Verkleinert man α, so vergrößert man β (und umgekehrt), wieso?
Ich mache mir mal selber Gedanken darüber:
α: Das Versuchsergebnis landet im Ablehnungsbereich, obwohl H0 richtig ist. Um α also zu verkleinern, muss der Ablehnungsbereich verkleinert und der Annahmebereich (folglich) vergrößert werden.
β: Versuchsergebnis liegt im Annahmebereich, obwohl H0 falsch ist. Um β zu verkleinern, muss also der Annehmabereich verkleinert und der Ablehnungsbereich vergrößert werden. (Das steht im Widerspruch zu oben). Man kann also beide Fehler nicht gleichzeitig minimieren.

So und jetzt möchte mann einen Wert für α und β finden, bei dem der Gesamtfehler am minimalsten ist. Klingt nach einer Extremwertaufgabe (Tiefpunkt finden). Aber von welcher Funktion soll man den Tiefpunkt finden, von der Funktion, die jedem α und β einen Gesamtfehler zuordnet, also f(α,β).
Gehen wir davon aus, dass es zwei Hypothese gibt. H0:p=p0 und H1:p=p1. α ist ja soetwas wie eine bedingte Wahrscheinlichkeit (unter der Bedingung, dass H0 wahr ist, soll das Ergebnis im Ablehnungsbereich liegen) für β gilt es analog. Im Baumdiagramm kann man dann die Pfadwahrscheinlichkeiten bilden und die Gesamtwahrscheinlichkeit berechnen: f(α,β)=p0α+p1β. Ich weiß nicht, ob meine Überlegnungen bisher alle stimmen, es kann auch sein, dass ich es wieder unnötig kompliziert mache, aber auf jedenfall kann ich keine dreidimensionale Funktion (außer eine Schar) ableiten. Und das hier ist ja soetwas wie eine doppelte Funktionenschar (2 Parameter) mit zwei Variablen, super! :-P)

Und dieser minimalste Wert ist immder das Signifikanzniveau? Also die Aufgabensteller haben dann die Funktion abgeleitet und so das Niveau bestimmt? Und wenn man als armer Abiturient selber ein Niveau festlegen soll, was dann?

Man kann ja auch einfach die Nullhypothese so wählen, dass es vieeel wichtiger ist, den α Fehler gering zu halten als den β Fehler. Ich dachte halt bisher immer, dass das Signifikanzniveau unabhängig von β ist.

In dem Zusammenhang verstehe ich auch nicht, wieso der Schitt zweier Histogramme (was auch immer ein solcher Schnitt sein soll) das Signifikanzniveau liefert.

Fragen über Fragen...


Sabine2

Sabine2 aktiv_icon

22:32 Uhr, 29.12.2012

Antworten
Ich brauche noch Hilfe. Bitte bitte :-)
Antwort
prodomo

prodomo aktiv_icon

11:53 Uhr, 03.01.2013

Antworten
Zum besseren Verständnis des Alternativtestes habe ich ein Beispiel mit Grafiken zusammengestellt. Zwei Sorten eines Produktes (z.B. erste und zweite Wahl bei Kacheln) sollen unterschieden werden. A enthält einen Anteil von 10% fehlerhaften, B von 25%. Man überprüft 12 Kacheln und soll danach entscheiden, welche Sorte vorliegt.
Die Nullhypothese lautet: es handelt sich um A. Jetzt wird ausgerechnet, wie dann die Binomialverteilung aussieht, also B(12;0,1;k) für k=0..12. Dazu ist das Histogramm1 beigefügt. Das gleiche macht man für die Alternativhypothese ("es ist B" ) beim Histogramm2. Beim dritten Bild sind beide übereinandergelegt. Man sieht, dass man sich bei 0 und 1 defekten für Sorte A entscheiden sollte, bei 2 oder mehr für B. Der Fehler 1. Art (die Nullhypothese wird abgeleht, obwohl sie stimmt) ist im Bild durch die blaue Histogrammfläche rechts von 1,5 dargestellt, der Fehler 2. Art entsprechend durch die rote links von 1,5. Würde man die Grenze anders ziehen (z.B. bei 2,5), dann würde der Fehler 1. Art kleiner werden, dafür aber der Fehler 2. Art steigen.

histogramm1
histogramm2
histogramm3
Sabine2

Sabine2 aktiv_icon

17:08 Uhr, 03.01.2013

Antworten
So wie ich das einschätze driften wir zu weit von meiner eigentlichen Frage ab. Ich möchte ja nur wissen, welcher Ablehnungsbereich richtig ist (und wieso) und warum man mit einem Alternativtest begründet ablehnen, aber nicht begründet annehmen kann.

Trotzdem finde ich deine Ausführung toll und kann es besser nachvollziehen. Wir haben gleich mit der Normalverteilung angefangen und garnicht mit Histogrammen gearbeitet. Trotzdem muss es doch möglich sein, das k zu berechnen, wo der gesamtfehler am geringsten ist, oder?


Antwort
prodomo

prodomo aktiv_icon

08:44 Uhr, 04.01.2013

Antworten
Deine erste Frage hatte ich schon beim ersten Mal beantwortet. Je nachdem, ob man Binomialverteilung (exakt) oder Normalverteilung (Näherung) anwendet, fällt das Ergebnis unterschiedlich aus.
Mache dir klar, dass man niemals "begründet" ablehnen oder annehmen kann. Dies würde ja voraussetzen, dass man mit einer dieser Entscheidungen Recht hätte. Aber sowohl die Wahl des Signifikanzniveaus als auch die letztliche Entscheidung beim Alternativtest sind persönliche Entscheidungen, für die man nur das Irrtumsrisiko begrenzen kann.
Auf Histogramme nicht einzugehen und direkt die Normalverteilung anzugehen, halte ich für einen didaktisch bedenklichen Weg - vorsichtig ausgedrückt.
Sabine2

Sabine2 aktiv_icon

14:00 Uhr, 04.01.2013

Antworten
Auch in den Ferien so früh hoch?

Aber wieso sagt man denn immer "man kan H0 begründet ablehnen, wenn..." und nie "man kann H0 begründet annehmen, wenn..."?

Ja ich weiß, aber daraus wurde ich nicht schlau.

Ich hatte ja die Bedingung P(X>k)0,047
So, dieses k liegt doch aber im Annahmebereich oder?
Meine Logik: Ich erhalte dann einen Wert a für k, ungefähr so: ka.a ist ja meistens eine Dezimalzahl, aber k. Also runde ich zunächst a auf eine Natürliche Zahl auf (wegen ) Ab jetzt ist a. ka. Wenn k=a ist, liegt dieses a ja noch im Annahmebereich. Annahmebereich [0;a], Ablehnungsbereich [a+1;n].

Soweit meine Logik.

Ist diese Problematik vielleicht der Grund, wieso man in den Abiaufgaben immer nur mit P(Xk)<... zu tun hat? :-P)
Antwort
prodomo

prodomo aktiv_icon

09:15 Uhr, 05.01.2013

Antworten
JETZT habe ich deine Frage (hoffentlich) richtig verstanden. Dein k=26,63 ist die oberste Grenze des Annahmebereiches. Der nächste ganzzahlige Wert 27 gehört bereits zum Ablehnungsbereich. Ich hatte die Frage ursprünglich auf den Unterschied Binomial-/Normalverteilung bezogen. Ob bei den Abi-Aufgaben immer anders gefragt wird, habe ich noch gar nicht überprüft. Ist aber im Prinzip auch egal. Viel interessanter fand ich die Nachricht, dass in NRW ein Quantensprung in der Schülerschaft eingesetzt hat: die Zahl der 1,0- Abiturienten ist stark gestiegen. Dazu fällt mir nur ein Spruch aus unserer Oberstufenbücherei ein: "wenn die Sonne des Wissens tief genug steht, werfen auch Zwerge lange Schatten".

Ja, Morgenstund hat Gold im Mund, auch wenn es vom Zahnarzt kommt. Bei uns gehört der Morgenkaffee eindeutig zu meinem Bereich.
Sabine2

Sabine2 aktiv_icon

13:24 Uhr, 05.01.2013

Antworten
Ah, super, jetzt ist's klar.
Der Zahnarzt scheint dich irgendwie magisch anzuziehen, oder? :-P)

Ich fasse noch einmal Zusammen: Als Oberbegriff steht Hypothesentest. Es gibt, bzw. in der Schule lernt man zwei Arten kennen.
(1) Den Alternativtest. In diesem Test hat man zwei Hypothesen H0 und H1, wovon man eine als Nullhypothese wählt. Man wählt die Hypothese als H0, die man aus persönlichem Interesse ablehnen möchte. Joa, dann testet man halt und stellt eine Entscheidungsregel auf. Man muss sich aber vor dem Testen einen Wert für den α Fehler überlegen, sofern dieser nicht vorgegeben ist. Je nach Situation hat man dann 1.1P(Xk)<α oder 1.2P(X>k)<α. In 1.1 gehört das k zum Ablehnungsbereich, in 1.2 gehört das k zum Annahmebereich.
Man kann abschließend noch den β Fehler berechnen.
Gibt es noch verschiedene Arten des Alternativtests? Ich habe zwischendurch mal die Begriffe rechtsseitig und linksseitig aufgeschnappt.

(2) Der Signifikanztest. Prinzipiell hat man nur eine gegebene Wahrscheinlichkeit p0, die andere ist dann meist <p0,>p0 oder einfach p0. Es gilt dann selbes wie beim Alternativtest. Nur den beta-Fehler kann man nicht berechnen. Wo genau liegt denn nun der Unterschied, zwischen dem Signifikanzniveau s, was man in P(Xk)<s verwendet und dem αP(Xk)<α? Beides sind doch obere Schranken für einen Fehler 1. Art...

Ist das vollständig und richtig? Ich musste mal ein wenig Ordnung reinbringen.

EDIT: Nein, ich verstehe es doch nicht... Ich hatte P(X>k)<0,047. Es ist doch richtig, dass k dann zum Annahmebereich gehört, oder? Okay, man erhält dann k26,63. Du meinst, der Ablehnungsbereich beträgt dann [27;n], der Annahmebereich [0;26]. Da aber k zum Annahmeberiech gehört und k auch 26,63 ist, verstehe ich nicht, wieso man für k nun 26 nehmen darf. 26 erfüllt k26,63 nicht! Und bitte benutze als Erklärung keine Probe. Das mag zwar richtig sein, erklärt mir aber nicht, wo mein Denkfehler liegt ;-)
Sabine2

Sabine2 aktiv_icon

22:20 Uhr, 07.01.2013

Antworten
Ich benötige bitte noch Hilfe :-)
Sabine2

Sabine2 aktiv_icon

13:26 Uhr, 12.01.2013

Antworten
Ich benötige bitte immernoch Hilfe.
Sabine2

Sabine2 aktiv_icon

17:49 Uhr, 14.01.2013

Antworten
Prodomo, ich brauche dich! :-D)
Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.