|
Hallo an alle und schon mal vorher danke für die Hilfe.
Gegeben sei bei mit ein Menge die ist annähernd logarithmisch normalver-teilt(lognormverteilt)(also keine Stichprobe). Die Lognormverteilung der Menge habe ich anhand eins quadrat Testes überprüft.
Berechne ich den Mittelwert(=Summe der Daten durch Anzahl der Daten) meiner Datenmenge in Excel so kommt heraus. Berechne ich die Standardabweichung mit Excel so kommt heraus.
Der Logarithmus einer Log Normverteilung ist normalverteilt.
Daraus folgt, dass man den Mittelwert (der Lognormverteilung) auch wie folgt berechnen kann. ^(Mittelwert des Logarithmus der Lognormverteilung Standardabweichung des Logarithmus der Lognormverteilung^(2)/2) (hab ich so aus Wikipedia und Matheforen herausgelesen). Wenn ich das mache, ergibt der Mittelwert in meinen Fall . Ich bitte um Korrektur falls ich hier schon falsch bin.
Nach oben dargelegter Denkweise ergibt sich die Standardabweichung demensprechend wie folgt =Wurzel aus ^(2*Mittelwert des Logarithmus der Lognormverteilung+ Standardabweichung des Logarithmus der Lognormverteilung^(2))*(e ^ (Standardabweichung des Logarithmus der Lognormverteilung^(2))-1). Hier ergibt sich bei meiner Datenmenge eine Standardabweichung von .
Meine Frage ist folgende: 1. Wie wird die Standardabweichung bei der Lognormverteilung definiert?
Bei der Normalverteilung ist die Standardabweichung die Zahl, bei der noch ca. aller Daten in der Umgebung des Mittelwertes liegen (zumindest hab ich es so verstanden). Geht man in meine Fall von dieser Definition aus, so liegen alle Daten die größer sind als (=exp(Mittelwert des Logarithmus der Lognormverteilung-Standardabweichung Logarithmus der Lognormverteilung)) und die kleiner sind als (=exp(Mittelwert des Logarithmus der Lognormverteilung +Standardabweichung Logarithmus der Lognormverteilung)) noch innerhalb des oben genannt Umgebung. Ich habs überprüft es sind tatsächlich der Daten aus der Datenmenge. Die sich so raus ergebende Standabweichung wäre aber . Welche Standardabweichung ist nun die richtige oder oder ? Ich weis das die Standardabweichung der Lognormverteilung keine große Aussagekraft hat, ich brauche sie aber, da ich damit den Flächeninhalt der Idealverteilung . wie würde die Kurve aussehen, wenn sie perfekt lognormverteilt wäre) berechnen möchte.
Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |
|
|
"Bei der Normalverteilung ist die Standardabweichung die Zahl, bei der noch ca. 68% aller Daten in der Umgebung des Mittelwertes liegen (zumindest hab ich es so verstanden)."
Nein. Standardabweichung ist Wurzel aus der Varianz und Varianz ist , wo -Zufallsvariable und -Erwartungswert. Das mit den ca. ist eine Besonderheit der Normalverteilung und keine Definition.
|
|
Danke schonmal für die Antwort.
Es bleibt für mich noch eine Frage:
Wie ist die Definition der Standartabweichung der Logarithmischen Normalverteilung gemeint? http://de.wikipedia.org/wiki/Logarithmische_Normalverteilung#Standardabweichung ich hab es so aufgefasst, dass my steht für Mittelwert des Logarithmus der Lognormverteilung und das steht Standardabweichung des Logarithmus der Lognormverteilung
wenn nein: für was steht und my ? Mittelwert und Standardabweichung der Lognormvereilung können es nicht sein, denn man kann ja die Standardabweichung nicht mit der Standardabweichung definieren, oder doch?
wenn ja: warum erhalte ich mit beiden Formeln unterschiedliche Ergebnisse?
Vielen Dank und mit freundlichem Gruß
|
|
Ohne Deine Daten zu sehen, kann ich nicht viel sagen. Ich weiß auch nicht, ob Du korrigierte oder nicht korrigierte Standardabweichung benutzt.
Aber eins kann ich Dir schon sagen. Und zwar eine Antwort darauf: "Wie ist die Definition der Standardabweichung der Logarithmischen Normalverteilung gemeint?" Eine Standardabweichung der Logarithmischen Normalverteilung wird überhaupt nicht definiert, sondern berechnet. Wie jede Standardabweichung berechnet wird. Eine Definition für Standardabweichung ist unabhängig von der Verteilung und diese Definition habe ich schon angegeben. Die Berechnungen stehen auch in Wikipedia.
Und und sind Parameter, denn es gibt nicht eine Logarithmischen Normalverteilung, sondern unendlich verschiedene, je nach den Werten von und . Einfach Parameter, sie sind wirklich kein Erwartungswert und keine Standardabweichung und auch sonst haben sie keine direkte Interpretation. Nur über die Verbindung zu der Normalverteilung.
|
|
Ok! Ich denke, ich hab mich falsch ausgedrückt.
Stellen wir uns vor, wir haben eine Datenmenge, die ist Lognormverteilt.
Wie bekommen ich jetzt den Mittelwert und die Standardabweichung dieser Datenmenge heraus.
Lösungsvorschlag 1: ich benutze die excell Formeln Mittelwert: ich addiere alle Daten und teile durch die Anzahl der Daten Standardabweichung: ich rechne aus wie weit alle Daten vom Mittelwert entfernt sind, quadriere das Ergebniss, bilde aus alle Ergebnissen die Summe und daraus dann die Wurzel.
Lösungsvorschlag 2: ich verwende die Formeln aus . Wikipedia http://de.wikipedia.org/wiki/Logarithmische_Normalverteilung#Erwartungswert http://de.wikipedia.org/wiki/Logarithmische_Normalverteilung#Standardabweichung Nur wie bekomme ich bei einer gegeben Datenmenge heraus wie groß und my sind? Ich hatte es so verstanden, dass die Standardabweichung der logarthmirten Datenmenge ist und My entsprechend der Mittelwert der logarthmirten Datenmenge. Wenn das falsch sein sollte: wie berechne ich und my?
Beide Lösungsvorschläge führen zu unterschiedlichen Ergebnissen!
Vielen Dank und schöne Grüße
|
|
"Beide Lösungsvorschläge führen zu unterschiedlichen Ergebnissen!"
Das ist auch logisch, denn Deine Datenmenge ist nur ANNÄHERND lognormal verteilt, nicht exakt. Und das ist ein großer Unterschied. Bei Anwendung der Formel aus Wikipedia werden dann aus relativ kleinen Fehlern der Annäherung schnell große Fehler des Endergebnises. Aber ohne konkrete Daten kann ich wie gesagt nicht genau zeigen, was passiert.
|
|
Hallo,
da sich meine Datenmenge auf Datensätze bezieht, ist es sicher nicht sinnvoll diese hier anzugeben. Darüber hinaus ist in der Praxis eine exakte Lognormverteilung wohl nicht anzutreffeb.
Ich hoffe, dass wir das Problem auch thoretische lösen können.
Also: interpretiere ich die Formel auf Wikipedia richtig oder falsch?
|
|
"Darüber hinaus ist in der Praxis eine exakte Lognormverteilung wohl nicht anzutreffen."
Wenn Du in der Praxis eine annähernd lognormale Verteilung hast, dann muss die logarithmierte Datenmenge überhaupt nicht mehr normal verteilt sein. Denn Logarithmus macht Dir aus einem kleinen Fehler locker einen großen. Deshalb wenn Du und aus den Daten ausrechnest, werden sie unter Umständen weit weg von "theoretischen" liegen.
"Also: interpretiere ich die Formel auf Wikipedia richtig oder falsch?"
Richtig. Theoretisch. :-)
|
|
also, wenn ich das richtig verstehe, ist Lösungsvorschlag 1 die tatsächliche Standardabweichung der Datenmenge und Lösungsvorschlag 2 die ideal Standardabweichung der Datenmennge.
Wenn meine Datenmenge exakt lognormverteilt wäre, müssten Lösungsvorschlag 1 und Lösungsvorschlag 2 übereinstimmen.
Wenn das jetzt richtig ist, habe ích noch eine letzte Frage:
Kann man im vorliegend Fall die Standardabweichung auch wie folgt berechnen exp (Mittelwert der logartmischen Datenmegen Standabweichung der logartmischen Datenmengen)- exp (Mittelwert der logartmischen Datenmegen - Standabweichung der logartmischen Datenmengen)?
Danke uns viele Grüße
|
|
"Wenn meine Datenmenge exakt lognormverteilt wäre, müssten Lösungsvorschlag 1 und Lösungsvorschlag 2 übereinstimmen."
Ja.
"Kann man im vorliegend Fall die Standardabweichung auch wie folgt berechnen exp (Mittelwert der logartmischen Datenmegen + Standabweichung der logartmischen Datenmengen)- exp (Mittelwert der logartmischen Datenmegen - Standabweichung der logartmischen Datenmengen)? "
Diese Formel verstehe ich nicht. Da würde doch rauskommen. Standardabweichung ist aber
|
|
Der Formel liegt folgender Gedanke zugrunde
Der Logarithmus einer Lognorverteilung ist normalverteilt. Bei einer Normalverteilung gilt auf Grund der Symmetrie: Mittelwert+ Standardabweichung - Mittewert- Standardabweichung = Standardabweichung
Ich sehe schon den ersten Fehler: Also nochmal Mittelwert Standardabweichung- Mittelwert Standardabweichung = Standardabweichung
Bring ich das auf die Ausgangswert zurück müsste folgen e(Mittelert Standardabweichung)-e(Mittelwert Standardabweichung)
Hier hat wieder der Gedankengang zugeschlagen ;-)
Viele Grüße
|
|
"Bring ich das auf die Ausgangswert zurück müsste folgen"
Natürlich nicht. Nimm einfach Mittelwert=10, Standardabweichung =2. Die erste Formel ist natürlich trivialerweise richtig, aber wenn Du berechnen würdest, kommt da niemals raus, auch nicht . Exponente ist nicht linear, deshalb funktioniert das nicht.
|
|
Guten Morgen,
natürlich kommt nicht 2 (=Standardabweichung der Normalverteilung) heraus, sondern (die Standardabweichung der Lognormverteilung).
Wie gesagt die Idee kommt von dem Gedankengang.
Anders gesagt: Bei einer normalverteilten Datenmenge sind der Daten im Bereich (Mittelwert+ Standardabweichung) -(Mittelwert - Standardabweichung)=2 Standardabweichung
Wobei ich gestehen muss, dass das Ergebniss was in meinem Fall herauskommt (Ergebnis Lösungsvorschlag und Ergebnis Lösungsvorschlag doch ziemlich absurd ist.
Ok ich seh eine das Fixierung auf die Repräsentation einer fest Datenmenge eine fixe Idee ist.
Viele Dank und viele Grüße
|