Mathematik online lernen im Mathe-Forum. Nachhilfe online

Startseite » Forum » Regression mit Pandeldaten: Vorgehensweise

Regression mit Pandeldaten: Vorgehensweise

Universität / Fachhochschule

Tests

Tags: Analyse, Pandeldaten, Statistik, test

Klausi123 aktiv_icon

17:40 Uhr, 07.02.2018

Hallo Zusammen,

ich beschäftige mich zur Zeit mit Regressionsanalysen bei Paneldaten und habe noch einige Fragen zu diesem Konzept.

Mal ein hypothetisches Beispiel:
Untersucht werden soll die Auswirkung einer Alkoholsteuer auf die Anzahl der Verkehrstoten in Deutschland. Es liegen für die

16

Bundesländer die Anzahl der Verkehrstoten für den Zeitraum der Jahre

2000

bis

2006

vor.

Nun wäre es ja ebenso mit einer „normalen“ Regression möglich diese Auswirkungen zu analysieren, jedoch ist die Wahrscheinlichkeit eines Onmitted Variable Bias mitunter sehr hoch. Daher wird zunächst mit Gruppenfixen Effekten gearbeitet, um für ausgelassene Variablen zu kontrollieren, die sich unterschiedlich auf die

16

Bundesländer auswirken aber ziemlich konstant über die Zeit sind. In dem Beispiel stelle ich mir für solche Effekte einfach mal unterschiedliche Promillegrenzen pro Bundesland oder eine unterschiedliche gesellschaftliche Stellung zum alkoholisierten Fahren pro Bundesland vor. Die Regressionsfunktion würde doch dann so aussehen:

y_it

= b_{0} + b_{1} \cdot

Alkoholsteuer_it

+ b_{2} \cdot Z_{i} +

u_it

Dabei steht der Index

i

für die Gruppe und

t

für die Zeit.

Z_{i}

steht für alle ausgelassenen Variablen, die sich unterschiedlich auf die Gruppen auswirken und konstant über die Zeit sind. In unserem Fall eben die unterschiedlichen Promillegrenzen etc.

Wenn wir nun schreiben Alpha_i

= b_{0} + b_{2} \cdot Z_{i}

ergibt sich

y_it

= b_{1} \cdot

Alkoholsteuer_it

+

Alpha_i

+

u_it

Nun steht in meinem Lehrbuch, dass somit für jede Gruppe (Bundesland) ein eigener Achsenabschnitt geschätzt wird. Ich verstehe aber nicht ganz von welchem Achsenabschnitt hier die Rede ist. Ein Achsenabschnitt in einem Diagramm welches auf der y-Achse die Verkehrstoten und auf der x-Achse die Alkoholsteuer abzeichnet oder wie kann ich mir das Ganze vorstellen?
Dementsprechend müsste es also

16

verschiedene Achsenabschnitte und somit auch

16

verschiedene Regressionsgeraden pro Jahr geben oder etwa nicht?

Außerdem ist mir nicht ganz klar, wieso auch die unabhängige Variable Alkoholsteuer den Index it besitzt. Am Ende möchte ich doch eine einzige Regression haben, welche die Auswirkungen einer Alkoholsteuer auf die Verkehrstoten in Deutschland approximiert. Aus diesem Grund verwirrt es mich noch, dass ich auch für jedes Bundesland einen eigenen Achsenabschnitt schätze.

Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."

ledum aktiv_icon

16:13 Uhr, 08.02.2018

dein Bsp ist recht eigenartig. wieso ist da die Zeit drin?
meinst du mit

y_{i t} y_{i} (t)

? dann hast di für

t = 0

schon

b_{0} + Z_{i}

ob man ein Diagram mit

16

Achsen macht, oder

16

einzelne diagramme, ist dasselbe, unter deinen vors hat ja des ergebnis in Bayern nichts mit dem in Berlin zu tun, oder das stellt sich erst nach der Auswertung raus?
eigentlich willst du doch nur die Auswirkung der Steuer untersuchen? hat sich die denn in der betrachteten Zeit mehrfach verändert?
Gruß ledum

Klausi123 aktiv_icon

16:33 Uhr, 08.02.2018

Hallo Ledum,

vielen Dank für deine Antwort. Das Beispiel ist ein wenig abgewandelt aus einem Lehrbuch entnommen. Im Anhang ist die entsprechende Beschreibung zu finden.

Ich hatte das Ganze so verstanden, dass bei Gruppenfixen Effekten für ausgelassene Variablen kontrolliert wird, die über die Zeit konstant sind, sich aber unterschiedlich auf die einzelnen Gruppen (Bundesländer auswirken). Vielleicht habe ich das Beispiel im Lehrbuch auch nicht ganz verstanden und es falsch wiedergegeben

\frac{:}{}

ledum aktiv_icon

22:43 Uhr, 08.02.2018

Hallo
dein deutscher Text war schon sehr irritierend, schon allein weil Alkoholsteuern bei uns Bundes und nicht Ländersache sind.
Aber was sind denn nun deine Fragen? der Text bei dem für mich eine Zwischenseite fehlt ist doch relativ klar?
Gruß ledum

Klausi123 aktiv_icon

15:28 Uhr, 09.02.2018

Hallo Ledum,

bitte entschuldige die Verwirrung, dass war tatsächlich nicht ganz eindeutig beschrieben. Ich habe noch einige Fragen zum allgemeinen Konzept der Regressionsanalyse mit Paneldaten und versuche im folgenden mein Verständnis dieses Konzepts so klar wie möglich zu beschreiben. Bitte korrigiere mich, falls ich etwas nicht richtig verstanden haben sollte.

Anhand des Beispiels im Buch soll - wie ja nun bekannt - untersucht werden, wie sich eine Biersteuer auf die Rate der Verkehrstoten auswirkt. Dazu liegen Daten zu den Verkehrstoten in jedem Staat in den USA im Zeitraum von

1982 - 1988

sowie Daten zu den Biersteuern in jedem Staat für denselben Zeitraum vor.

Ich stelle mir also für jedes Jahr einen Scatterplot vor, wo auf der y-Achse die Rate der Verkehrstoten und auf der x-Achse die Höhe der Alkoholsteuer abgetragen ist. Ein Punkt steht jeweils für die Verkehrstoten-Rate eines Staates mit der entsprechenden Biersteuer in diesem Staat.

Um nun zu untersuchen welche Auswirkungen eine Biersteuer auf die Rate der Verkehrstoten in den USA hat, soll mit Hilfe von Paneldaten eine Regressionsanalyse durchgeführt werden. Zunächst sollen dafür Gruppenfixe Effekte verwendet werden, um die Einflüsse von nicht aufgenommenen Variablen (weil bspw. keine Daten zu diesen vorliegen) zu eliminieren und somit eine Verzerrung der Schätzer verhindern.

Das allgemeine Modell sieht dann so aus:

y_it

= β_{0} + β_{1} \cdot

Biersteuer_it

+ β_{2} \cdot Z_{i} +

u_it

Wobei

Z_{i}

alle nicht aufgenommenen Einflüsse beschreibt, die unterschiedlich auf die einzelnen Staaten aber relativ konstant über die Zeit wirken ( wie

z . b

. die gesellschaftliche Stellung in den verschiedenen Staaten ggü. dem betrunkenen Auto fahren).

Nächster Schritt:

α_{i} = β_{0} + β_{2} \cdot Z_{i}

\to α

spiegelt nun meinen Gruppenfixen Effekt wieder und wird in die obige Gleichung eingesetzt.

y_it

= β_{1} \cdot

Biersteuer_it

+ α_{i} +

u_it

Für den Bundesstaat Texas sieht dann die Funktion

z . b

. so aus:
VerkehrstotenRate_Texas_1982

= - 0.5 \cdot

Biersteuer_Texas_1982

+

GruppenfixeEffekte (Die Gruppenfixen Effekte stellen das

β_{0}

also den x-Achsenabschnitt meiner Regressionsgeraden dar)

Von dieser Gleichung gibt es dann für das Jahr

1982

noch

46

weitere mit unterschiedlichen Achsenabschnitten (GruppenfixeEffekte)

Soweit habe ich das Konzept - vermutlich - verstanden. Nun verwirrt mich aber die Aussage, dass für jeden Staat ein eigener Achsenabschnitt geschätzt wird. Wenn ich mir wieder den Scatterplot für das Jahr

1982

vorstelle, mit der Rate der Verkehrstoten auf der y-Achse und der Biersteuer auf der x-Achse, habe ich nun also in diesem Scatterplot insgesamt

47

verschiedene x-Achsenabschnitte und somit auch

47

verschiedene Regressionsgeraden? Wie komme ich denn aber dann über

47

Achsenabschnitte für das Jahr

1982

auf eine einzelne Regressionsgerade, die mir den allgemeinen Zusammenhang zwischen der Alkoholsteuer und den Verkehrstoten in den USA aufzeigt?

Bei den zeitfixen Effekten, die alle Staaten gleich treffen aber unterschiedliche über die Jahre sind habe ich dasselbe Problem:

y_it

= β_{0} + β_{1} \cdot

Biersteuer_it

+ β_{2} \cdot S_{t} +

u_it

\to

mit

S_{t}

als Effekte die unterschiedlich über die Jahre und gleich auf Staaten wirken (Fortschritt in der Sicherheitstechnik der Autos bspw.)

γ_{t} = β_{0} + β_{2} \cdot S_{t} \to

spiegelt nun meinen Zeitfixen Effekt wieder und wird in die obige Gleichung eingesetzt.

y_it

= β_{1} \cdot

Biersteuer_it

+ γ_{t} +

u_it

\to

Regressionsgerade zur Schätzung mit zeitfixen Effekten.

Hier verstehe ich die Aussagen, dass für jedes Jahr ein unterschiedlicher Achsenabschnitt geschätzt wird, auch nicht.
Bedeutet das, dass unter alleiniger Berücksichtigung von zeitfixen Effekten jeder Staat denselben x-Achsenabschnitt auf dem Scatterplott (Todesrate/Biersteuer) hat und nur unterschiedliche Steigungen aufweist? Und wenn ich nur mit gruppenfixen Effekten schätze, erhalte ich für jeden Staat einen unterschiedlichen Achsenabschnitt und unterschiedliche Steigungen?

Wenn ich nun also meine Gruppen- und zeitfixen Effekte verbinde erhalte ich folgendes Modell:

y_it = Biersteuer_it

+ α_{i} + γ_{t} +

u_it

Ich erhalte also im Jahr

1982

für jeden Staat einen unterschiedlichen Achsenabschnitt. Dieser Ergibt sich aus den individuellen Gruppenfixen Effekten für jeden Staat und aus dem zeitfixen Effekt für das Jahr

1982

. Für die folgenden Jahre ändern sich die Achsenabschnitte der Staaten nur noch auf Grund der zeitfixen Effekte. Dies ergibt sich aus der Tatsache, dass die Gruppenfixen Effekte über die zeit konstant sind. Wenn ich das so korrekt verstanden habe frage ich mich abschließend nur noch, wie ich bei den ganzen Regressionsgeraden auf eine einzelne komme. Werden dann einfach durchschnitte der entsprechenden Schätzer gebildet?

Ich hoffe der Text ist nicht zu sehr ausgeartet. Ich wollte meine Fragen dieses mal so genau wie möglich erläutern.

Vielen Dank für deine Bemühungen

ledum aktiv_icon

17:10 Uhr, 10.02.2018

Hallo
da sich die Biersteuer ja wohl nicht in einem Jahr ändert, kann ich mir nur vorstellen, dass man alle Jahre plottet um den Einfluß der Steuer zu sehen, da sie in verschiedenen staaten verschieden ist und due

Z

auch, bekoomt man verschiedene Plots pro Staat.
die Steigung bedeutet jeweils die abhängigkeit von der Biersteuer, Wenn man jetz nur die Abh. von der Steuer rauskriegen will, muss man die Steigung der Geraden betrachten. steigt die zahl der toten obwohl die biesteuer gleich bleibt oder sinkt sie in einem Staat, mit steigender Biesteuer bleibt im anderen konstant, kann man wohl einfach nichts schließen, im besten Fall bekommt man in jedem Staat einen ähnlichen Zusammenhang und kann dann eine Gesamtanalyse machen, in der die anderen Einflüsse rausgerechnet sind.
soweit mein Verständnis.
Gruß ledum

Klausi123 aktiv_icon

20:45 Uhr, 11.02.2018

Vielen Dank :-)

1414593

1413939

	Status: nicht eingeloggt	Noch nicht registriert?