Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Lognormverteilung

Lognormverteilung

Universität / Fachhochschule

Tags: Standardabweichung

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
Anni22

Anni22 aktiv_icon

15:43 Uhr, 06.11.2014

Antworten
Hallo an alle und schon mal vorher danke für die Hilfe.

Gegeben sei bei mit ein Menge die ist annähernd logarithmisch normalver-teilt(lognormverteilt)(also keine Stichprobe). Die Lognormverteilung der Menge habe ich
anhand eins χ- quadrat Testes überprüft.

Berechne ich den Mittelwert(=Summe der Daten durch Anzahl der Daten) meiner
Datenmenge in Excel so kommt 131,5 heraus.
Berechne ich die Standardabweichung mit Excel so kommt 181,67 heraus.

Der Logarithmus einer Log Normverteilung ist normalverteilt.

Daraus folgt, dass man den Mittelwert (der Lognormverteilung) auch wie folgt berechnen kann. E(X)=e ^(Mittelwert des Logarithmus der Lognormverteilung +
Standardabweichung des Logarithmus der Lognormverteilung^(2)/2) (hab ich so aus Wikipedia und Matheforen herausgelesen). Wenn ich das mache, ergibt der Mittelwert in meinen Fall 134,06.
Ich bitte um Korrektur falls ich hier schon falsch bin.

Nach oben dargelegter Denkweise ergibt sich die Standardabweichung demensprechend wie folgt =Wurzel aus (e ^(2*Mittelwert des Logarithmus der Lognormverteilung+
Standardabweichung des Logarithmus der Lognormverteilung^(2))*(e ^ (Standardabweichung des Logarithmus der Lognormverteilung^(2))-1).
Hier ergibt sich bei meiner Datenmenge eine Standardabweichung von 221,45.

Meine Frage ist folgende:
1. Wie wird die Standardabweichung bei der Lognormverteilung definiert?

Bei der Normalverteilung ist die Standardabweichung die Zahl, bei der noch ca. 68% aller Daten in der Umgebung des Mittelwertes liegen (zumindest hab ich es so verstanden).
Geht man in meine Fall von dieser Definition aus, so liegen alle Daten die größer sind als 22,03 (=exp(Mittelwert des Logarithmus der Lognormverteilung-Standardabweichung
Logarithmus der Lognormverteilung)) und die kleiner sind als 218,58 (=exp(Mittelwert des Logarithmus der Lognormverteilung +Standardabweichung Logarithmus der
Lognormverteilung)) noch innerhalb des oben genannt Umgebung. Ich habs überprüft es sind tatsächlich 68,7% der Daten aus der Datenmenge.
Die sich so raus ergebende Standabweichung wäre aber 196,55.
Welche Standardabweichung ist nun die richtige
181,67 oder 221,45 oder 190,55?
Ich weis das die Standardabweichung der Lognormverteilung keine große Aussagekraft hat, ich brauche sie aber, da ich damit den Flächeninhalt der Idealverteilung (d.h. wie würde die Kurve aussehen, wenn sie perfekt lognormverteilt wäre) berechnen möchte.


Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."
Online-Nachhilfe in Mathematik
Antwort
DrBoogie

DrBoogie aktiv_icon

10:42 Uhr, 14.11.2014

Antworten
"Bei der Normalverteilung ist die Standardabweichung die Zahl, bei der noch ca. 68% aller Daten in der Umgebung des Mittelwertes liegen (zumindest hab ich es so verstanden)."

Nein. Standardabweichung ist Wurzel aus der Varianz und Varianz ist
E(X-E(X))2, wo X-Zufallsvariable und E-Erwartungswert.
Das mit den ca. 68% ist eine Besonderheit der Normalverteilung und keine Definition.

Anni22

Anni22 aktiv_icon

14:47 Uhr, 17.11.2014

Antworten
Danke schonmal für die Antwort.

Es bleibt für mich noch eine Frage:

Wie ist die Definition der Standartabweichung der Logarithmischen Normalverteilung gemeint?
http://de.wikipedia.org/wiki/Logarithmische_Normalverteilung#Standardabweichung
ich hab es so aufgefasst, dass
my steht für Mittelwert des Logarithmus der Lognormverteilung
und das σ steht Standardabweichung des Logarithmus der Lognormverteilung

wenn nein: für was steht σ und my ?
Mittelwert und Standardabweichung der Lognormvereilung können es nicht sein, denn man kann ja die Standardabweichung nicht mit der Standardabweichung definieren,
oder doch?

wenn ja: warum erhalte ich mit beiden Formeln unterschiedliche Ergebnisse?

Vielen Dank und mit freundlichem Gruß
Antwort
DrBoogie

DrBoogie aktiv_icon

23:15 Uhr, 17.11.2014

Antworten
Ohne Deine Daten zu sehen, kann ich nicht viel sagen.
Ich weiß auch nicht, ob Du korrigierte oder nicht korrigierte Standardabweichung benutzt.

Aber eins kann ich Dir schon sagen.
Und zwar eine Antwort darauf: "Wie ist die Definition der Standardabweichung der Logarithmischen Normalverteilung gemeint?"
Eine Standardabweichung der Logarithmischen Normalverteilung wird überhaupt nicht definiert, sondern berechnet. Wie jede Standardabweichung berechnet wird. Eine Definition für Standardabweichung ist unabhängig von der Verteilung und diese Definition habe ich schon angegeben. Die Berechnungen stehen auch in Wikipedia.

Und σ und μ sind Parameter, denn es gibt nicht eine Logarithmischen Normalverteilung, sondern unendlich verschiedene, je nach den Werten von σ und μ. Einfach Parameter, sie sind wirklich kein Erwartungswert und keine Standardabweichung und auch sonst haben sie keine direkte Interpretation. Nur über die Verbindung zu der Normalverteilung.
Anni22

Anni22 aktiv_icon

11:08 Uhr, 18.11.2014

Antworten
Ok! Ich denke, ich hab mich falsch ausgedrückt.

Stellen wir uns vor, wir haben eine Datenmenge, die ist Lognormverteilt.

Wie bekommen ich jetzt den Mittelwert und die Standardabweichung dieser Datenmenge heraus.

Lösungsvorschlag 1: ich benutze die excell Formeln
Mittelwert: ich addiere alle Daten und teile durch die Anzahl der Daten
Standardabweichung: ich rechne aus wie weit alle Daten vom Mittelwert entfernt sind, quadriere das Ergebniss, bilde aus alle Ergebnissen die Summe und daraus dann die Wurzel.

Lösungsvorschlag 2: ich verwende die Formeln aus z.B. Wikipedia
http://de.wikipedia.org/wiki/Logarithmische_Normalverteilung#Erwartungswert
http://de.wikipedia.org/wiki/Logarithmische_Normalverteilung#Standardabweichung
Nur wie bekomme ich bei einer gegeben Datenmenge heraus wie groß σ und my sind?
Ich hatte es so verstanden, dass σ die Standardabweichung der logarthmirten Datenmenge ist und My entsprechend der Mittelwert der logarthmirten Datenmenge.
Wenn das falsch sein sollte: wie berechne ich σ und my?

Beide Lösungsvorschläge führen zu unterschiedlichen Ergebnissen!

Vielen Dank und schöne Grüße
Antwort
DrBoogie

DrBoogie aktiv_icon

12:05 Uhr, 18.11.2014

Antworten
"Beide Lösungsvorschläge führen zu unterschiedlichen Ergebnissen!"

Das ist auch logisch, denn Deine Datenmenge ist nur ANNÄHERND lognormal verteilt, nicht exakt. Und das ist ein großer Unterschied. Bei Anwendung der Formel aus Wikipedia werden dann aus relativ kleinen Fehlern der Annäherung schnell große Fehler des Endergebnises.
Aber ohne konkrete Daten kann ich wie gesagt nicht genau zeigen, was passiert.
Anni22

Anni22 aktiv_icon

14:06 Uhr, 18.11.2014

Antworten
Hallo,

da sich meine Datenmenge auf 3000 Datensätze bezieht, ist es sicher nicht sinnvoll diese hier anzugeben.
Darüber hinaus ist in der Praxis eine exakte Lognormverteilung wohl nicht anzutreffeb.

Ich hoffe, dass wir das Problem auch thoretische lösen können.

Also: interpretiere ich die Formel auf Wikipedia richtig oder falsch?


Antwort
DrBoogie

DrBoogie aktiv_icon

14:17 Uhr, 18.11.2014

Antworten
"Darüber hinaus ist in der Praxis eine exakte Lognormverteilung wohl nicht anzutreffen."

Wenn Du in der Praxis eine annähernd lognormale Verteilung hast, dann muss die logarithmierte Datenmenge überhaupt nicht mehr normal verteilt sein. Denn Logarithmus macht Dir aus einem kleinen Fehler locker einen großen. Deshalb wenn Du μ und σ aus den Daten ausrechnest, werden sie unter Umständen weit weg von "theoretischen" liegen.

"Also: interpretiere ich die Formel auf Wikipedia richtig oder falsch?"

Richtig. Theoretisch. :-)


Anni22

Anni22 aktiv_icon

17:14 Uhr, 18.11.2014

Antworten
also, wenn ich das richtig verstehe, ist Lösungsvorschlag 1 die tatsächliche Standardabweichung der Datenmenge
und Lösungsvorschlag 2 die ideal Standardabweichung der Datenmennge.

Wenn meine Datenmenge exakt lognormverteilt wäre, müssten Lösungsvorschlag 1 und Lösungsvorschlag 2 übereinstimmen.

Wenn das jetzt richtig ist, habe ích noch eine letzte Frage:

Kann man im vorliegend Fall die Standardabweichung auch wie folgt berechnen
exp (Mittelwert der logartmischen Datenmegen + Standabweichung der logartmischen Datenmengen)-
exp (Mittelwert der logartmischen Datenmegen - Standabweichung der logartmischen Datenmengen)?

Danke uns viele Grüße
Antwort
DrBoogie

DrBoogie aktiv_icon

17:21 Uhr, 18.11.2014

Antworten
"Wenn meine Datenmenge exakt lognormverteilt wäre, müssten Lösungsvorschlag 1 und Lösungsvorschlag 2 übereinstimmen."

Ja.


"Kann man im vorliegend Fall die Standardabweichung auch wie folgt berechnen
exp (Mittelwert der logartmischen Datenmegen + Standabweichung der logartmischen Datenmengen)-
exp (Mittelwert der logartmischen Datenmegen - Standabweichung der logartmischen Datenmengen)? "

Diese Formel verstehe ich nicht. Da würde doch eμ+σ-eμ-σ rauskommen. Standardabweichung ist aber eμ+σ2/2σ2-1.


Anni22

Anni22 aktiv_icon

18:30 Uhr, 18.11.2014

Antworten
Der Formel liegt folgender Gedanke zugrunde

Der Logarithmus einer Lognorverteilung ist normalverteilt.
Bei einer Normalverteilung gilt auf Grund der Symmetrie:
Mittelwert+ Standardabweichung -
Mittewert- Standardabweichung = Standardabweichung

Ich sehe schon den ersten Fehler:
Also nochmal
Mittelwert +12 Standardabweichung-
Mittelwert -12 Standardabweichung = Standardabweichung

Bring ich das auf die Ausgangswert zurück müsste folgen
e(Mittelert +12 Standardabweichung)-e(Mittelwert -12 Standardabweichung)

Hier hat wieder der 68% Gedankengang zugeschlagen ;-)

Viele Grüße
Antwort
DrBoogie

DrBoogie aktiv_icon

18:37 Uhr, 18.11.2014

Antworten
"Bring ich das auf die Ausgangswert zurück müsste folgen"

Natürlich nicht.
Nimm einfach Mittelwert=10, Standardabweichung =2.
Die erste Formel ist natürlich trivialerweise richtig, 11-9=2 aber wenn Du e11-e9 berechnen würdest, kommt da niemals 2 raus, auch nicht e2. Exponente ist nicht linear, deshalb funktioniert das nicht.

Anni22

Anni22 aktiv_icon

11:25 Uhr, 19.11.2014

Antworten
Guten Morgen,

natürlich kommt e(11)-e(9) nicht 2 (=Standardabweichung der Normalverteilung) heraus, sondern 51771 (die Standardabweichung der Lognormverteilung).

Wie gesagt die Idee kommt von dem 68% Gedankengang.

Anders gesagt:
Bei einer normalverteilten Datenmenge sind 68% der Daten
im Bereich (Mittelwert+ Standardabweichung) -(Mittelwert - Standardabweichung)=2 Standardabweichung

Wobei ich gestehen muss, dass das Ergebniss was in meinem Fall herauskommt 1962=98 (Ergebnis Lösungsvorschlag 1=181 und Ergebnis Lösungsvorschlag 2=221) doch ziemlich absurd ist.

Ok ich seh eine das Fixierung auf die Repräsentation einer fest Datenmenge eine fixe Idee ist.

Viele Dank und viele Grüße