|
Hi!
Da ich nicht weiß, in welches Unterforum meine Frage gehört, habe ich Sonstiges angegeben weitere geraten. Bitte entschuldigt eventuelle Fehler.
Ich benötige mal einen Tipp, weil ich hier mit meiner Schulmathematik nicht weiterkomme.
Ich habe bei einer Abfrage über einen Sprachkorpus die Möglichkeit, die Resultate (=Textauszüge, in denen . ein bestimmtes Wort vorkommt), die in der Stichprobe sein werden, einzuschränken und zwar mit Hilfe von Werten aus verschiedenen Kategorien.
Es gibt: Kategorien (bspw.: Alter des Textpoduzenten, Geschlecht des Textproduzenten, etc.) - insg. Werte, verteilt über diese Kategorien. Allerdings ist die Zahl der Werte pro Kategorie unterschiedlich.
Nun brauche ich die Anzahl der möglichen Kombinationen von Werten für die Abfrage, bzw. einen *Weg* dahin.
Beispiel: - Kat. A hat 3 Werte. Alleine in dieser Kat. gibt es also bereits 7 Möglichkeiten, Werte zu kombinieren . - Kat. hat 2 Werte. Hier gibt es Möglichkeiten, die Werte zu kombinieren - Da es sich bei den Werten um "Auswahlfelder" handelt, hat die Auswahl von allen Werten das gleiche Resultat, wie wenn keine Werte ausgewählt sind.
Jetzt geht es mir daum zu ermitteln, um am Beispiel zu bleiben, wieviele Kombinationen es über die Kategorien gibt. Ich fang die Reihe mal an: (Alle Wertkombinationen aus keine Wertauswahl in (alle Wertkombinationen aus keine Wertauswahl in etc. pp.
Die Anzahl der Werte in den einzelnen Kategorien folgt: - Kat I: 3 Werte - Kat II: 5 Werte - Kat III: 5 Werte - Kat IV: 6 Werte - Kat Werte - Kat VI: 3 Werte - Kat VII: 3 Werte - Kat VIII: 5 Werte - Kat IX: 6 Werte - Kat Werte - Kat XI: 3 Werte - Kat XII: 4 Werte - Kat XIII: 3 Werte - Kat XIV: Werte
Ich wäre SOWAS von unglaublich dankbar, wenn mir hier jemand auf die Sprünge helfen könnte!
Vielen Dank im Voraus! Stephan
Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |
|
vulpi
20:04 Uhr, 20.08.2010
|
HI, ich hab' ein Verständnisproblem. Sollen denn in allen Kategorien Mehrwachauswahlen möglich sein ? Wie soll das dann bei Alter oder Geschlecht funktionieren ?
Oder gibt es Kategorien mit Einzelauswahl , und wenn ja welche ?
?
|
|
Aha, in der Tat ein guter Hinweis. Danke!
Es sind Mehrfachauswahlen in allen Fällen möglich, weil die Auswahl jeweils das Ergebnis "verkleinert", wenn nichts ausgewählt wird, oder alles ausgewählt wird, wird der "komplette Korpus" ausgegeben (um es mal vereinfacht zu sagen).
Um bei Deinem Hinweis zu bleiben: wählt man "männlich" aus, werden nur die Texte ausgegeben, die von Männern produziert wurden, bei weiblich nur die von weiblichen 'Sprechern', wenn man beides (oder keins von beidem) auswählt, werden Texte sowohl von männlichen als auch von weiblichen Sprechern ausgegeben.
Danke nochmal für den Hinweis.
|
vulpi
20:52 Uhr, 20.08.2010
|
Hi, meine Frage war dämlich, pardon ! Es geht bei der Auswahl ja um Suchfilter.
Dann gibt es doch pro Kategorie unterschiedliche Ausswahlmuster, da ja . und . äquvivalent sind, daher eine Variation weniger.
Die verschiedenen Variationen über die Kategorien ist doch dann einfach
etc.
also gibt es
mögliche Abfragen, denk ich mal.
mfg
|
|
Kann man das dann nicht auch mit (Formeleditor funktioniert leider gerade nicht): hoch ausdrücken? Den Tip habe ich gerade in einem anderen Forum bekommen und wollte ihn gerne teilen. In meinem Fall hieße das also: hoch :-)...
Vielen Dank auf jeden Fall.
|
vulpi
21:30 Uhr, 20.08.2010
|
Hi, wenn du . 5 ja/nein Felder hast, dann kannst du dir die möglichen Eingaben , also
usw. usw.
als 5 stellige Binärzahlen darstellen,also bis das sind mögliche Zahlen In deinem Fall haben aber und den gleichen Wert, . mit würde eine Auswahl doppelt gezählt, darum
Kat 1 hat also somit 7 Variationen, Kat 2 hat Ich kann also mit kombinieren, macht also zusammen mögliche Eingaben für und so geht das Spiel dann weiter, . Das Produkt aller Faktoren ergibt dann die Zahl möglicher Eingaben.
|
vulpi
21:36 Uhr, 20.08.2010
|
ist aber dann nur eine Näherung. Beispiel: 2 Kategorien mit 3 Feldern 000XXX und XXX000 und XXXXXX und würden nach der n)-Methode aber als verschieden gezählt. Diese müßte man dann alle wieder herausrechnen, was bei Gruppen ein ziemlicher Aufwand wird.
mfg
|
|
Besten Dank! Ich bin jetzt tatsächlich durchgestiegen :-). Grüße!
|
|
Hi & 'Tschuldigung für die "Wiedereröffnung".
Ich habe ein Ergebnis errechnet und möchte das gerne gegenprüfen lassen von jemandem, der Ahnung hat. Da ich nicht weiß, mit welchem Werkzeug man so eine Formel direkt berechnen kann, habe ich die Auflösung (?) berechnet nach dem Muster .
Also mit meinen Kategoriewerten: . .
Mit Ganzzahlen: . .
Habe dabei als Ergebnis raus: .
Ist das korrekt? Wenn ja, wäre ja die Abweichung von der Annäherung oben enorm!
Vielen Dank nochmal & im Voraus!
|
vulpi
12:38 Uhr, 22.08.2010
|
Hallo again !
Die hohe Diskrepanz kommt daher, weil du dich schlicht verzählt hast. Es sind gemäß Tabelle Werte, nicht . Die beiden Ergebnisse differieren aber immer noch um den Faktor
Nochmal kuze Übersicht:
Fall 1: 0-Auswahl und Komplett-Auswahl sind VERSCHIEDENE Werte Dann wärs cool, jeder Wert hat dann Ausprägungen. . Mit wär' die Sache damit erledigt. (Und auch keine mehr, jede 101-stelle Binärzahl gilt ja dann, alle 0 und auch alle also
Fall 2: 0-Auswahl und Komplett-Auswahl sind GLEICHE Werte (semantisch gesehen) Also werden nicht die multipliziert, sondern wie gesagt jeweils um 1 vermindert.
Du hast 6 3er, eine 5er, 3 6er und einen 46er Die alle aufmultipliziert ergibt
Basen reduzierte 2er-Potenzen, Exp. = Häufigkeit Jetzt stell die Näherung gegenüber, diese multipliziert die nicht reduzierten Faktoren: Basen normale 2er-Potenzen
Wenn du jetz ausrechnest, ergibt sich die Abweichung
ca.1
Das heißt, das grobe Ergebnis wo größere Zahlen multipliziert werden, ist um den Faktor zu viel.
Das korrekte Ergebnis ist somit
Die Methode hätte evtl. den Vorteil, im TR keine Monsterzahlen aufzumultiplizieren, man multipliziert für ja nur Zahlen nahe 1 Allerdings kann man ja bei Monsterprodukten den guten alten Logarithmus bemühen, so gesehen also eigentlich egal. Ach ja, den letzten Faktor für also kann man sich wohl schenken. Ich hoffe, hilfreich gewesen zu sein :-) mfg
|
Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.
|