Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Anzahl Kombinationen von 104 Werten?

Anzahl Kombinationen von 104 Werten?

Universität / Fachhochschule

Sonstiges

Rekursives Zählen

Verteilungsfunktionen

Tags: Kategorien, Kombination, Korpus, Newbie, Rekursives Zählen, Sonstiges, Verteilungsfunktion, Wert

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
tropicofvector

tropicofvector aktiv_icon

19:54 Uhr, 20.08.2010

Antworten
Hi!

Da ich nicht weiß, in welches Unterforum meine Frage gehört, habe ich Sonstiges angegeben + weitere geraten. Bitte entschuldigt eventuelle Fehler.

Ich benötige mal einen Tipp, weil ich hier mit meiner Schulmathematik nicht weiterkomme.

Ich habe bei einer Abfrage über einen Sprachkorpus die Möglichkeit, die Resultate (=Textauszüge, in denen z.B. ein bestimmtes Wort vorkommt), die in der Stichprobe sein werden, einzuschränken und zwar mit Hilfe von Werten aus verschiedenen Kategorien.

Es gibt:
-14 Kategorien (bspw.: Alter des Textpoduzenten, Geschlecht des Textproduzenten, etc.)
- insg. 104 Werte, verteilt über diese 14 Kategorien. Allerdings ist die Zahl der Werte pro Kategorie unterschiedlich.

Nun brauche ich die Anzahl der möglichen Kombinationen von Werten für die Abfrage, bzw. einen *Weg* dahin.

Beispiel:
- Kat. A hat 3 Werte. Alleine in dieser Kat. gibt es also bereits 7 Möglichkeiten, Werte zu kombinieren (A1,A1+A2,A1+A3,A1+A2+A3,A2,A2+A3,A3).
- Kat. B hat 2 Werte. Hier gibt es X Möglichkeiten, die Werte zu kombinieren (B1,B1+B2,B2)
- Da es sich bei den Werten um "Auswahlfelder" handelt, hat die Auswahl von allen Werten das gleiche Resultat, wie wenn keine Werte ausgewählt sind.

Jetzt geht es mir daum zu ermitteln, um am Beispiel zu bleiben, wieviele Kombinationen es über die Kategorien gibt. Ich fang die Reihe mal an:
(Alle Wertkombinationen aus A+ keine Wertauswahl in B), (alle Wertkombinationen aus B+ keine Wertauswahl in A),(A1+B1),(A1+A2+B1),(A1+A2+A3+B1),(A1+A3+B1),(A1+B2),(A1+B1+B2), etc. pp.

Die Anzahl der Werte in den einzelnen Kategorien folgt:
- Kat I: 3 Werte
- Kat II: 5 Werte
- Kat III: 5 Werte
- Kat IV: 6 Werte
- Kat V:6 Werte
- Kat VI: 3 Werte
- Kat VII: 3 Werte
- Kat VIII: 5 Werte
- Kat IX: 6 Werte
- Kat X:3 Werte
- Kat XI: 3 Werte
- Kat XII: 4 Werte
- Kat XIII: 3 Werte
- Kat XIV: 46 Werte

Ich wäre SOWAS von unglaublich dankbar, wenn mir hier jemand auf die Sprünge helfen könnte!

Vielen Dank im Voraus!
Stephan

Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."
Online-Nachhilfe in Mathematik
Antwort
vulpi

vulpi aktiv_icon

20:04 Uhr, 20.08.2010

Antworten
HI,
ich hab' ein Verständnisproblem.
Sollen denn in allen Kategorien Mehrwachauswahlen möglich sein ?
Wie soll das dann bei Alter oder Geschlecht funktionieren ?

Oder gibt es Kategorien mit Einzelauswahl , und wenn ja welche ?

?


tropicofvector

tropicofvector aktiv_icon

20:38 Uhr, 20.08.2010

Antworten
Aha, in der Tat ein guter Hinweis. Danke!

Es sind Mehrfachauswahlen in allen Fällen möglich, weil die Auswahl jeweils das Ergebnis "verkleinert", d.h., wenn nichts ausgewählt wird, oder alles ausgewählt wird, wird der "komplette Korpus" ausgegeben (um es mal vereinfacht zu sagen).

Um bei Deinem Hinweis zu bleiben: wählt man "männlich" aus, werden nur die Texte ausgegeben, die von Männern produziert wurden, bei weiblich nur die von weiblichen 'Sprechern', wenn man beides (oder keins von beidem) auswählt, werden Texte sowohl von männlichen als auch von weiblichen Sprechern ausgegeben.

Danke nochmal für den Hinweis.
Antwort
vulpi

vulpi aktiv_icon

20:52 Uhr, 20.08.2010

Antworten
Hi, meine Frage war dämlich, pardon !
Es geht bei der Auswahl ja um Suchfilter.

Dann gibt es doch pro Kategorie 2ni-1 unterschiedliche Ausswahlmuster,
da ja 00000... und 11111.... äquvivalent sind, daher eine Variation weniger.

Die verschiedenen Variationen über die Kategorien ist doch dann einfach

(2n1-1)(2n2-1)(2n3-1) etc.

also gibt es

Πi=114(2ni-1) mögliche Abfragen, denk ich mal.

mfg
tropicofvector

tropicofvector aktiv_icon

21:10 Uhr, 20.08.2010

Antworten
Kann man das dann nicht auch mit (Formeleditor funktioniert leider gerade nicht):
(2 hoch n)-1 ausdrücken? Den Tip habe ich gerade in einem anderen Forum bekommen und wollte ihn gerne teilen.
In meinem Fall hieße das also: (2 hoch 104)-1=20282409603651669999999999999999 :-)...

Vielen Dank auf jeden Fall.
Antwort
vulpi

vulpi aktiv_icon

21:30 Uhr, 20.08.2010

Antworten
Hi, wenn du z.B. 5 ja/nein Felder hast, dann kannst du dir die möglichen
Eingaben , also

0X000
X0000
00X0X
XXX00
usw. usw.

als 5 stellige Binärzahlen darstellen,also
00000 bis 11111
das sind 25 mögliche Zahlen
In deinem Fall haben aber 00000 und 11111 den gleichen Wert, d.h.
mit 25 würde eine Auswahl doppelt gezählt, darum 25-1

Kat 1 hat also somit 7 Variationen, Kat 2 hat 31
Ich kann also 7K1 mit 31K2 kombinieren, macht also zusammen 731
mögliche Eingaben für K1 und K2
so geht das Spiel dann weiter,
K3:31
K4:63
...
Das Produkt aller Faktoren ergibt dann die Zahl möglicher Eingaben.





Antwort
vulpi

vulpi aktiv_icon

21:36 Uhr, 20.08.2010

Antworten
2104 ist aber dann nur eine Näherung.
Beispiel: 2 Kategorien mit 3 Feldern
000XXX und XXX000 und XXXXXX und 000000 würden nach der
2 n)-Methode aber als verschieden gezählt.
Diese müßte man dann alle wieder herausrechnen, was bei 14 Gruppen
ein ziemlicher Aufwand wird.

mfg

Frage beantwortet
tropicofvector

tropicofvector aktiv_icon

01:20 Uhr, 21.08.2010

Antworten
Besten Dank! Ich bin jetzt tatsächlich durchgestiegen :-).
Grüße!
tropicofvector

tropicofvector aktiv_icon

12:15 Uhr, 21.08.2010

Antworten
Hi & 'Tschuldigung für die "Wiedereröffnung".

Ich habe ein Ergebnis errechnet und möchte das gerne gegenprüfen lassen von jemandem, der Ahnung hat. Da ich nicht weiß, mit welchem Werkzeug man so eine Formel direkt berechnen kann, habe ich die Auflösung (?) berechnet nach dem Muster 2ni-1.

Also mit meinen Kategoriewerten: (23-1)(25-1)... (246-1).

Mit Ganzzahlen: 731... 70368744177663.

Habe dabei als Ergebnis raus: 9,25E+029.

Ist das korrekt? Wenn ja, wäre ja die Abweichung von der Annäherung oben enorm!

Vielen Dank nochmal & im Voraus!
Antwort
vulpi

vulpi aktiv_icon

12:38 Uhr, 22.08.2010

Antworten
Hallo again !

Die hohe Diskrepanz kommt daher, weil du dich schlicht verzählt hast.
Es sind gemäß Tabelle 101 Werte, nicht 104.
Die beiden Ergebnisse differieren aber immer noch um den Faktor 2,7

Nochmal kuze Übersicht:

Fall 1:
0-Auswahl und Komplett-Auswahl sind VERSCHIEDENE Werte
Dann wärs cool, jeder Wert hat dann 2n Ausprägungen.
2a2b2c... 2(a+b+c..)
Mit 2101=2,541030 wär' die Sache damit erledigt.
(Und auch keine -1 mehr, jede 101-stelle Binärzahl gilt ja dann, alle 0 und auch alle 1, also 2n)

Fall 2:
0-Auswahl und Komplett-Auswahl sind GLEICHE Werte (semantisch gesehen)
Also werden nicht die 2ni multipliziert, sondern wie gesagt jeweils um 1 vermindert.

Du hast 6 3er, eine 4,3 5er, 3 6er und einen 46er
Die alle aufmultipliziert ergibt

X=76151313633(246-1)1        Die Basen reduzierte 2er-Potenzen, Exp. = Häufigkeit
Jetzt stell die Näherung gegenüber, diese multipliziert die nicht reduzierten Faktoren:
N=86161323643(246)=2101            Die Basen normale 2er-Potenzen

Wenn du jetz NX ausrechnest, ergibt sich die Abweichung

f=NX=(87)6(1615)1(3231)3(6463)3 ca.1

f=2,74

Das heißt, das grobe Ergebnis 2101, wo größere Zahlen multipliziert werden,
ist um den Faktor 2,74 zu viel.

Das korrekte Ergebnis ist somit (2101f)=X=9,251025

Die Methode Nf hätte evtl. den Vorteil, im TR keine Monsterzahlen aufzumultiplizieren,
man multipliziert für f ja nur Zahlen nahe 1
Allerdings kann man ja bei Monsterprodukten den guten alten Logarithmus bemühen,
so gesehen also eigentlich egal.
Ach ja, den letzten Faktor für f, also 246246-1 kann man sich wohl schenken.
Ich hoffe, hilfreich gewesen zu sein :-)
mfg










Diese Frage wurde automatisch geschlossen, da der Fragesteller kein Interesse mehr an der Frage gezeigt hat.