|
Hallo,
wir haben heute im Unterricht (ja, wir sind eine der wenigen, die noch unterricht machen :-P)) einen Alternativtest durchgeführt und ich zweifel an dem, was mein Lehrer meinte. Er meint, er habe Recht und ich liege falsch, aber das verstehe ich nicht.
Folgendes:
-man hat 2 Töpfe mit Losen, in ihnen gibt es Preise und Nieten . Topf: Preise . Topf: Preise -man hat vergessen die Töpfe zu beschriften und will nun testen, ob man den 1. Topf erwischt hat (den benötigt man und nicht den -Signifikanzniveau
Es muss also versucht werden, die These, dass man den 2. Topf erwischt hat, abzulehnen. Anzahl der Preise in einem Topf, wenn man mal zieht. ist binomialverteilt. wird nur dann abgelehnt, wenn deutlich mehr als Preise gezogen werden.
So das nähert man dann mit der Normalverteilung an und kommt auf . Unser Lehrer meinte nun, dass der Ablehnungsbereich lautet. Das würde ja bedeuten, dass das noch zum Annahmebereich gehören würde. An dem Punkt habe ich aber widersprochen. Zu unrecht, wie mir dann erwidert wurde. Für mich lautet der Ablehnungsbereich . Wer hat Recht?
Und dann noch allgemeine Fragen zum Testen: Ist das nicht eigentlich hypergeometrisch verteilt? Also wird eine hypergeometrische Verteilung mit einer Binomialverteilung und die wieder mit einer Normalverteilung angenähert. Ein bisschen zuviel des Guten, oder nicht?
Außerdem verstehe ich nicht, wieso man mit einem Testverfahren eine These begründet ablehnen, aber nicht begründet annehmen kann.
Ich freue mich auf eure Antworten!
Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |
|
|
Da ist entweder im Unterricht oder in deinem Kopf (glaube ich nach den bisherigen Erörterungen aber eher nicht) etwas durcheinander geraten. Schon die Verwendung des Begriffes "Signifikanzniveau" hat bei mir alle Glocken schrillen lassen. Ein Signifikanzniveau ist ja eine willkürlich gesetzte Schwelle, ab der man ein bestimmtes Testergebnis nicht mehr als zufällig eingetreten anerkennen will. Der Alternativtest (deswegen heißt er ja so) beinhaltet dagegen zwei gleichberechtigte Hypothesen. Deswegen ist es auch im Prinzip egal, welche man als Nullhypothese nimmt. Es handelt sich zwar prinzipiell um hypergeometrische Verteilung (wie immer bei endlichen Mengen ohne Zurücklegen), aber man geht davon aus, dass die Zahl der Lose sehr groß ist, sodass bei Entnahmen die Chancen praktisch gleich bleiben (sonst wäre die Angabe der Treffer in Prozenten schon unsinnig). Die Wahrscheinlichkeit, dass man zwischen 0 und Treffer bekommt, ist . Bei Verwendung der Normalverteilung als Näherung ergibt sich weil die Tabelle liefert. Daraus folgt . Demnach liegt bei dieser Näherung die im Gegensatz zur Binomialverteilung schon über der zulässigen Grenze. Bei Verwendung des in SH zugelassenen nicht grafikfähigen TR Casio ist die Berechnung der exakten Summe in Sekunden erledigt. Allerdings ist die Vorgabe eines "Signifikanzniveaus" beim Alternativtest unüblich. Gebräuchlich ist "Fehler erster Art" oder "alpha-Fehler". Das Niveau wird unter Berücksichtigung beider Fehler so gewählt, dass der mögliche Gesamtfehler minimal wird. Je kleiner nämlich wird, desto größer wird . Zur Veranschaulichung kannst du dir die Histogramme für und in ein gemeinsames Koordinatensystem zeichnen. Dort, wo die Treppenkurven sich schneiden, liegt die Stelle des minimalen Gesamtfehlers.
|
|
Irgendwie verwirrt mich das immer mehr. Also welcher Ablehnungsbereich ist nun richtig? Und wir haben im Unterricht die Begriffe Signifikanzniveau und Fehler gleichgesetzt, was in meinen Augen aber auch keinen Sinn ergeben hat. Das Signifikanzniveau ist ja nur eine obere Schranke für die ja aber in der Fälle nicht erfüllt wird. Man kann das also meinen Augen) garnicht gleichsetzen.
Verkleinert man so vergrößert man (und umgekehrt), wieso? Ich mache mir mal selber Gedanken darüber: Das Versuchsergebnis landet im Ablehnungsbereich, obwohl richtig ist. Um also zu verkleinern, muss der Ablehnungsbereich verkleinert und der Annahmebereich (folglich) vergrößert werden. Versuchsergebnis liegt im Annahmebereich, obwohl falsch ist. Um zu verkleinern, muss also der Annehmabereich verkleinert und der Ablehnungsbereich vergrößert werden. (Das steht im Widerspruch zu oben). Man kann also beide Fehler nicht gleichzeitig minimieren.
So und jetzt möchte mann einen Wert für und finden, bei dem der Gesamtfehler am minimalsten ist. Klingt nach einer Extremwertaufgabe (Tiefpunkt finden). Aber von welcher Funktion soll man den Tiefpunkt finden, von der Funktion, die jedem und einen Gesamtfehler zuordnet, also . Gehen wir davon aus, dass es zwei Hypothese gibt. und . ist ja soetwas wie eine bedingte Wahrscheinlichkeit (unter der Bedingung, dass wahr ist, soll das Ergebnis im Ablehnungsbereich liegen) für gilt es analog. Im Baumdiagramm kann man dann die Pfadwahrscheinlichkeiten bilden und die Gesamtwahrscheinlichkeit berechnen: . Ich weiß nicht, ob meine Überlegnungen bisher alle stimmen, es kann auch sein, dass ich es wieder unnötig kompliziert mache, aber auf jedenfall kann ich keine dreidimensionale Funktion (außer eine Schar) ableiten. Und das hier ist ja soetwas wie eine doppelte Funktionenschar Parameter) mit zwei Variablen, super! :-P)
Und dieser minimalste Wert ist immder das Signifikanzniveau? Also die Aufgabensteller haben dann die Funktion abgeleitet und so das Niveau bestimmt? Und wenn man als armer Abiturient selber ein Niveau festlegen soll, was dann?
Man kann ja auch einfach die Nullhypothese so wählen, dass es vieeel wichtiger ist, den Fehler gering zu halten als den Fehler. Ich dachte halt bisher immer, dass das Signifikanzniveau unabhängig von ist.
In dem Zusammenhang verstehe ich auch nicht, wieso der Schitt zweier Histogramme (was auch immer ein solcher Schnitt sein soll) das Signifikanzniveau liefert.
Fragen über Fragen...
|
|
Ich brauche noch Hilfe. Bitte bitte :-)
|
|
Zum besseren Verständnis des Alternativtestes habe ich ein Beispiel mit Grafiken zusammengestellt. Zwei Sorten eines Produktes . erste und zweite Wahl bei Kacheln) sollen unterschieden werden. A enthält einen Anteil von fehlerhaften, von . Man überprüft Kacheln und soll danach entscheiden, welche Sorte vorliegt. Die Nullhypothese lautet: es handelt sich um A. Jetzt wird ausgerechnet, wie dann die Binomialverteilung aussieht, also für . Dazu ist das Histogramm1 beigefügt. Das gleiche macht man für die Alternativhypothese ("es ist B" ) beim Histogramm2. Beim dritten Bild sind beide übereinandergelegt. Man sieht, dass man sich bei 0 und 1 defekten für Sorte A entscheiden sollte, bei 2 oder mehr für B. Der Fehler 1. Art (die Nullhypothese wird abgeleht, obwohl sie stimmt) ist im Bild durch die blaue Histogrammfläche rechts von dargestellt, der Fehler 2. Art entsprechend durch die rote links von . Würde man die Grenze anders ziehen . bei dann würde der Fehler 1. Art kleiner werden, dafür aber der Fehler 2. Art steigen.
|
|
So wie ich das einschätze driften wir zu weit von meiner eigentlichen Frage ab. Ich möchte ja nur wissen, welcher Ablehnungsbereich richtig ist (und wieso) und warum man mit einem Alternativtest begründet ablehnen, aber nicht begründet annehmen kann.
Trotzdem finde ich deine Ausführung toll und kann es besser nachvollziehen. Wir haben gleich mit der Normalverteilung angefangen und garnicht mit Histogrammen gearbeitet. Trotzdem muss es doch möglich sein, das zu berechnen, wo der gesamtfehler am geringsten ist, oder?
|
|
Deine erste Frage hatte ich schon beim ersten Mal beantwortet. Je nachdem, ob man Binomialverteilung (exakt) oder Normalverteilung (Näherung) anwendet, fällt das Ergebnis unterschiedlich aus. Mache dir klar, dass man niemals "begründet" ablehnen oder annehmen kann. Dies würde ja voraussetzen, dass man mit einer dieser Entscheidungen Recht hätte. Aber sowohl die Wahl des Signifikanzniveaus als auch die letztliche Entscheidung beim Alternativtest sind persönliche Entscheidungen, für die man nur das Irrtumsrisiko begrenzen kann. Auf Histogramme nicht einzugehen und direkt die Normalverteilung anzugehen, halte ich für einen didaktisch bedenklichen Weg - vorsichtig ausgedrückt.
|
|
Auch in den Ferien so früh hoch?
Aber wieso sagt man denn immer "man kan begründet ablehnen, wenn..." und nie "man kann begründet annehmen, wenn..."?
Ja ich weiß, aber daraus wurde ich nicht schlau.
Ich hatte ja die Bedingung So, dieses liegt doch aber im Annahmebereich oder? Meine Logik: Ich erhalte dann einen Wert a für ungefähr so: ist ja meistens eine Dezimalzahl, aber . Also runde ich zunächst a auf eine Natürliche Zahl auf (wegen Ab jetzt ist . . Wenn ist, liegt dieses a ja noch im Annahmebereich. Annahmebereich Ablehnungsbereich .
Soweit meine Logik.
Ist diese Problematik vielleicht der Grund, wieso man in den Abiaufgaben immer nur mit . zu tun hat? :-P)
|
|
JETZT habe ich deine Frage (hoffentlich) richtig verstanden. Dein ist die oberste Grenze des Annahmebereiches. Der nächste ganzzahlige Wert gehört bereits zum Ablehnungsbereich. Ich hatte die Frage ursprünglich auf den Unterschied Binomial-/Normalverteilung bezogen. Ob bei den Abi-Aufgaben immer anders gefragt wird, habe ich noch gar nicht überprüft. Ist aber im Prinzip auch egal. Viel interessanter fand ich die Nachricht, dass in NRW ein Quantensprung in der Schülerschaft eingesetzt hat: die Zahl der Abiturienten ist stark gestiegen. Dazu fällt mir nur ein Spruch aus unserer Oberstufenbücherei ein: "wenn die Sonne des Wissens tief genug steht, werfen auch Zwerge lange Schatten".
Ja, Morgenstund hat Gold im Mund, auch wenn es vom Zahnarzt kommt. Bei uns gehört der Morgenkaffee eindeutig zu meinem Bereich.
|
|
Ah, super, jetzt ist's klar. Der Zahnarzt scheint dich irgendwie magisch anzuziehen, oder? :-P)
Ich fasse noch einmal Zusammen: Als Oberbegriff steht Hypothesentest. Es gibt, bzw. in der Schule lernt man zwei Arten kennen. Den Alternativtest. In diesem Test hat man zwei Hypothesen und wovon man eine als Nullhypothese wählt. Man wählt die Hypothese als die man aus persönlichem Interesse ablehnen möchte. Joa, dann testet man halt und stellt eine Entscheidungsregel auf. Man muss sich aber vor dem Testen einen Wert für den Fehler überlegen, sofern dieser nicht vorgegeben ist. Je nach Situation hat man dann oder . In gehört das zum Ablehnungsbereich, in gehört das zum Annahmebereich. Man kann abschließend noch den Fehler berechnen. Gibt es noch verschiedene Arten des Alternativtests? Ich habe zwischendurch mal die Begriffe rechtsseitig und linksseitig aufgeschnappt.
Der Signifikanztest. Prinzipiell hat man nur eine gegebene Wahrscheinlichkeit die andere ist dann meist oder einfach . Es gilt dann selbes wie beim Alternativtest. Nur den beta-Fehler kann man nicht berechnen. Wo genau liegt denn nun der Unterschied, zwischen dem Signifikanzniveau was man in verwendet und dem ? Beides sind doch obere Schranken für einen Fehler 1. Art...
Ist das vollständig und richtig? Ich musste mal ein wenig Ordnung reinbringen.
EDIT: Nein, ich verstehe es doch nicht... Ich hatte . Es ist doch richtig, dass dann zum Annahmebereich gehört, oder? Okay, man erhält dann . Du meinst, der Ablehnungsbereich beträgt dann der Annahmebereich . Da aber zum Annahmeberiech gehört und auch ist, verstehe ich nicht, wieso man für nun nehmen darf. erfüllt nicht! Und bitte benutze als Erklärung keine Probe. Das mag zwar richtig sein, erklärt mir aber nicht, wo mein Denkfehler liegt ;-)
|
|
Ich benötige bitte noch Hilfe :-)
|
|
Ich benötige bitte immernoch Hilfe.
|
|
Prodomo, ich brauche dich! :-D)
|
Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.
|