Mathematik online lernen im Mathe-Forum. Nachhilfe online
Startseite » Forum » Regression mit Pandeldaten: Vorgehensweise

Regression mit Pandeldaten: Vorgehensweise

Universität / Fachhochschule

Tests

Tags: Analyse, Pandeldaten, Statistik, test

 
Antworten Neue Frage stellen Im Forum suchen
Neue Frage
Klausi123

Klausi123 aktiv_icon

17:40 Uhr, 07.02.2018

Antworten
Hallo Zusammen,

ich beschäftige mich zur Zeit mit Regressionsanalysen bei Paneldaten und habe noch einige Fragen zu diesem Konzept.

Mal ein hypothetisches Beispiel:
Untersucht werden soll die Auswirkung einer Alkoholsteuer auf die Anzahl der Verkehrstoten in Deutschland. Es liegen für die 16 Bundesländer die Anzahl der Verkehrstoten für den Zeitraum der Jahre 2000 bis 2006 vor.

Nun wäre es ja ebenso mit einer „normalen“ Regression möglich diese Auswirkungen zu analysieren, jedoch ist die Wahrscheinlichkeit eines Onmitted Variable Bias mitunter sehr hoch. Daher wird zunächst mit Gruppenfixen Effekten gearbeitet, um für ausgelassene Variablen zu kontrollieren, die sich unterschiedlich auf die 16 Bundesländer auswirken aber ziemlich konstant über die Zeit sind. In dem Beispiel stelle ich mir für solche Effekte einfach mal unterschiedliche Promillegrenzen pro Bundesland oder eine unterschiedliche gesellschaftliche Stellung zum alkoholisierten Fahren pro Bundesland vor. Die Regressionsfunktion würde doch dann so aussehen:

y_it =b0+b1 Alkoholsteuer_it +b2Zi+ u_it

Dabei steht der Index i für die Gruppe und t für die Zeit.

Zi steht für alle ausgelassenen Variablen, die sich unterschiedlich auf die Gruppen auswirken und konstant über die Zeit sind. In unserem Fall eben die unterschiedlichen Promillegrenzen etc.

Wenn wir nun schreiben Alpha_i =b0+b2Zi ergibt sich

y_it =b1 Alkoholsteuer_it + Alpha_i + u_it

Nun steht in meinem Lehrbuch, dass somit für jede Gruppe (Bundesland) ein eigener Achsenabschnitt geschätzt wird. Ich verstehe aber nicht ganz von welchem Achsenabschnitt hier die Rede ist. Ein Achsenabschnitt in einem Diagramm welches auf der y-Achse die Verkehrstoten und auf der x-Achse die Alkoholsteuer abzeichnet oder wie kann ich mir das Ganze vorstellen?
Dementsprechend müsste es also 16 verschiedene Achsenabschnitte und somit auch 16 verschiedene Regressionsgeraden pro Jahr geben oder etwa nicht?

Außerdem ist mir nicht ganz klar, wieso auch die unabhängige Variable Alkoholsteuer den Index it besitzt. Am Ende möchte ich doch eine einzige Regression haben, welche die Auswirkungen einer Alkoholsteuer auf die Verkehrstoten in Deutschland approximiert. Aus diesem Grund verwirrt es mich noch, dass ich auch für jedes Bundesland einen eigenen Achsenabschnitt schätze.



Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert):
"Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen."
Online-Nachhilfe in Mathematik
Antwort
ledum

ledum aktiv_icon

16:13 Uhr, 08.02.2018

Antworten
dein Bsp ist recht eigenartig. wieso ist da die Zeit drin?
meinst du mit yityi(t)? dann hast di für t=0 schon b0+Zi
ob man ein Diagram mit 16 Achsen macht, oder 16 einzelne diagramme, ist dasselbe, unter deinen vors hat ja des ergebnis in Bayern nichts mit dem in Berlin zu tun, oder das stellt sich erst nach der Auswertung raus?
eigentlich willst du doch nur die Auswirkung der Steuer untersuchen? hat sich die denn in der betrachteten Zeit mehrfach verändert?
Gruß ledum
Klausi123

Klausi123 aktiv_icon

16:33 Uhr, 08.02.2018

Antworten
Hallo Ledum,

vielen Dank für deine Antwort. Das Beispiel ist ein wenig abgewandelt aus einem Lehrbuch entnommen. Im Anhang ist die entsprechende Beschreibung zu finden.

Ich hatte das Ganze so verstanden, dass bei Gruppenfixen Effekten für ausgelassene Variablen kontrolliert wird, die über die Zeit konstant sind, sich aber unterschiedlich auf die einzelnen Gruppen (Bundesländer auswirken). Vielleicht habe ich das Beispiel im Lehrbuch auch nicht ganz verstanden und es falsch wiedergegeben :

IMG_0674
IMG_0675
Antwort
ledum

ledum aktiv_icon

22:43 Uhr, 08.02.2018

Antworten
Hallo
dein deutscher Text war schon sehr irritierend, schon allein weil Alkoholsteuern bei uns Bundes und nicht Ländersache sind.
Aber was sind denn nun deine Fragen? der Text bei dem für mich eine Zwischenseite fehlt ist doch relativ klar?
Gruß ledum
Klausi123

Klausi123 aktiv_icon

15:28 Uhr, 09.02.2018

Antworten
Hallo Ledum,

bitte entschuldige die Verwirrung, dass war tatsächlich nicht ganz eindeutig beschrieben. Ich habe noch einige Fragen zum allgemeinen Konzept der Regressionsanalyse mit Paneldaten und versuche im folgenden mein Verständnis dieses Konzepts so klar wie möglich zu beschreiben. Bitte korrigiere mich, falls ich etwas nicht richtig verstanden haben sollte.

Anhand des Beispiels im Buch soll - wie ja nun bekannt - untersucht werden, wie sich eine Biersteuer auf die Rate der Verkehrstoten auswirkt. Dazu liegen Daten zu den Verkehrstoten in jedem Staat in den USA im Zeitraum von 1982-1988 sowie Daten zu den Biersteuern in jedem Staat für denselben Zeitraum vor.

Ich stelle mir also für jedes Jahr einen Scatterplot vor, wo auf der y-Achse die Rate der Verkehrstoten und auf der x-Achse die Höhe der Alkoholsteuer abgetragen ist. Ein Punkt steht jeweils für die Verkehrstoten-Rate eines Staates mit der entsprechenden Biersteuer in diesem Staat.

Um nun zu untersuchen welche Auswirkungen eine Biersteuer auf die Rate der Verkehrstoten in den USA hat, soll mit Hilfe von Paneldaten eine Regressionsanalyse durchgeführt werden. Zunächst sollen dafür Gruppenfixe Effekte verwendet werden, um die Einflüsse von nicht aufgenommenen Variablen (weil bspw. keine Daten zu diesen vorliegen) zu eliminieren und somit eine Verzerrung der Schätzer verhindern.

Das allgemeine Modell sieht dann so aus:

y_it =β0+β1 Biersteuer_it +β2Zi+ u_it

Wobei Zi alle nicht aufgenommenen Einflüsse beschreibt, die unterschiedlich auf die einzelnen Staaten aber relativ konstant über die Zeit wirken ( wie z.b. die gesellschaftliche Stellung in den verschiedenen Staaten ggü. dem betrunkenen Auto fahren).

Nächster Schritt:

αi=β0+β2Zi
α spiegelt nun meinen Gruppenfixen Effekt wieder und wird in die obige Gleichung eingesetzt.

y_it =β1 Biersteuer_it +αi+ u_it

Für den Bundesstaat Texas sieht dann die Funktion z.b. so aus:
VerkehrstotenRate_Texas_1982 =-0.5 Biersteuer_Texas_1982 + GruppenfixeEffekte (Die Gruppenfixen Effekte stellen das β0 also den x-Achsenabschnitt meiner Regressionsgeraden dar)

Von dieser Gleichung gibt es dann für das Jahr 1982 noch 46 weitere mit unterschiedlichen Achsenabschnitten (GruppenfixeEffekte)

Soweit habe ich das Konzept - vermutlich - verstanden. Nun verwirrt mich aber die Aussage, dass für jeden Staat ein eigener Achsenabschnitt geschätzt wird. Wenn ich mir wieder den Scatterplot für das Jahr 1982 vorstelle, mit der Rate der Verkehrstoten auf der y-Achse und der Biersteuer auf der x-Achse, habe ich nun also in diesem Scatterplot insgesamt 47 verschiedene x-Achsenabschnitte und somit auch 47 verschiedene Regressionsgeraden? Wie komme ich denn aber dann über 47 Achsenabschnitte für das Jahr 1982 auf eine einzelne Regressionsgerade, die mir den allgemeinen Zusammenhang zwischen der Alkoholsteuer und den Verkehrstoten in den USA aufzeigt?

Bei den zeitfixen Effekten, die alle Staaten gleich treffen aber unterschiedliche über die Jahre sind habe ich dasselbe Problem:

y_it =β0+β1 Biersteuer_it +β2St+ u_it
mit St als Effekte die unterschiedlich über die Jahre und gleich auf Staaten wirken (Fortschritt in der Sicherheitstechnik der Autos bspw.)

γt=β0+β2St spiegelt nun meinen Zeitfixen Effekt wieder und wird in die obige Gleichung eingesetzt.

y_it =β1 Biersteuer_it +γt+ u_it
Regressionsgerade zur Schätzung mit zeitfixen Effekten.

Hier verstehe ich die Aussagen, dass für jedes Jahr ein unterschiedlicher Achsenabschnitt geschätzt wird, auch nicht.
Bedeutet das, dass unter alleiniger Berücksichtigung von zeitfixen Effekten jeder Staat denselben x-Achsenabschnitt auf dem Scatterplott (Todesrate/Biersteuer) hat und nur unterschiedliche Steigungen aufweist? Und wenn ich nur mit gruppenfixen Effekten schätze, erhalte ich für jeden Staat einen unterschiedlichen Achsenabschnitt und unterschiedliche Steigungen?

Wenn ich nun also meine Gruppen- und zeitfixen Effekte verbinde erhalte ich folgendes Modell:

y_it = Biersteuer_it +αi+γt+ u_it

Ich erhalte also im Jahr 1982 für jeden Staat einen unterschiedlichen Achsenabschnitt. Dieser Ergibt sich aus den individuellen Gruppenfixen Effekten für jeden Staat und aus dem zeitfixen Effekt für das Jahr 1982. Für die folgenden Jahre ändern sich die Achsenabschnitte der Staaten nur noch auf Grund der zeitfixen Effekte. Dies ergibt sich aus der Tatsache, dass die Gruppenfixen Effekte über die zeit konstant sind. Wenn ich das so korrekt verstanden habe frage ich mich abschließend nur noch, wie ich bei den ganzen Regressionsgeraden auf eine einzelne komme. Werden dann einfach durchschnitte der entsprechenden Schätzer gebildet?

Ich hoffe der Text ist nicht zu sehr ausgeartet. Ich wollte meine Fragen dieses mal so genau wie möglich erläutern.

Vielen Dank für deine Bemühungen
Antwort
ledum

ledum aktiv_icon

17:10 Uhr, 10.02.2018

Antworten
Hallo
da sich die Biersteuer ja wohl nicht in einem Jahr ändert, kann ich mir nur vorstellen, dass man alle Jahre plottet um den Einfluß der Steuer zu sehen, da sie in verschiedenen staaten verschieden ist und due Z auch, bekoomt man verschiedene Plots pro Staat.
die Steigung bedeutet jeweils die abhängigkeit von der Biersteuer, Wenn man jetz nur die Abh. von der Steuer rauskriegen will, muss man die Steigung der Geraden betrachten. steigt die zahl der toten obwohl die biesteuer gleich bleibt oder sinkt sie in einem Staat, mit steigender Biesteuer bleibt im anderen konstant, kann man wohl einfach nichts schließen, im besten Fall bekommt man in jedem Staat einen ähnlichen Zusammenhang und kann dann eine Gesamtanalyse machen, in der die anderen Einflüsse rausgerechnet sind.
soweit mein Verständnis.
Gruß ledum
Frage beantwortet
Klausi123

Klausi123 aktiv_icon

20:45 Uhr, 11.02.2018

Antworten
Vielen Dank :-)