|
Hallo Zusammen,
ich beschäftige mich zur Zeit mit Regressionsanalysen bei Paneldaten und habe noch einige Fragen zu diesem Konzept.
Mal ein hypothetisches Beispiel: Untersucht werden soll die Auswirkung einer Alkoholsteuer auf die Anzahl der Verkehrstoten in Deutschland. Es liegen für die Bundesländer die Anzahl der Verkehrstoten für den Zeitraum der Jahre bis vor.
Nun wäre es ja ebenso mit einer „normalen“ Regression möglich diese Auswirkungen zu analysieren, jedoch ist die Wahrscheinlichkeit eines Onmitted Variable Bias mitunter sehr hoch. Daher wird zunächst mit Gruppenfixen Effekten gearbeitet, um für ausgelassene Variablen zu kontrollieren, die sich unterschiedlich auf die Bundesländer auswirken aber ziemlich konstant über die Zeit sind. In dem Beispiel stelle ich mir für solche Effekte einfach mal unterschiedliche Promillegrenzen pro Bundesland oder eine unterschiedliche gesellschaftliche Stellung zum alkoholisierten Fahren pro Bundesland vor. Die Regressionsfunktion würde doch dann so aussehen:
y_it Alkoholsteuer_it u_it
Dabei steht der Index für die Gruppe und für die Zeit.
steht für alle ausgelassenen Variablen, die sich unterschiedlich auf die Gruppen auswirken und konstant über die Zeit sind. In unserem Fall eben die unterschiedlichen Promillegrenzen etc.
Wenn wir nun schreiben Alpha_i ergibt sich
y_it Alkoholsteuer_it Alpha_i u_it
Nun steht in meinem Lehrbuch, dass somit für jede Gruppe (Bundesland) ein eigener Achsenabschnitt geschätzt wird. Ich verstehe aber nicht ganz von welchem Achsenabschnitt hier die Rede ist. Ein Achsenabschnitt in einem Diagramm welches auf der y-Achse die Verkehrstoten und auf der x-Achse die Alkoholsteuer abzeichnet oder wie kann ich mir das Ganze vorstellen? Dementsprechend müsste es also verschiedene Achsenabschnitte und somit auch verschiedene Regressionsgeraden pro Jahr geben oder etwa nicht?
Außerdem ist mir nicht ganz klar, wieso auch die unabhängige Variable Alkoholsteuer den Index it besitzt. Am Ende möchte ich doch eine einzige Regression haben, welche die Auswirkungen einer Alkoholsteuer auf die Verkehrstoten in Deutschland approximiert. Aus diesem Grund verwirrt es mich noch, dass ich auch für jedes Bundesland einen eigenen Achsenabschnitt schätze.
Für alle, die mir helfen möchten (automatisch von OnlineMathe generiert): "Ich möchte die Lösung in Zusammenarbeit mit anderen erstellen." |
|
ledum 
16:13 Uhr, 08.02.2018
|
dein Bsp ist recht eigenartig. wieso ist da die Zeit drin? meinst du mit ? dann hast di für schon ob man ein Diagram mit Achsen macht, oder einzelne diagramme, ist dasselbe, unter deinen vors hat ja des ergebnis in Bayern nichts mit dem in Berlin zu tun, oder das stellt sich erst nach der Auswertung raus? eigentlich willst du doch nur die Auswirkung der Steuer untersuchen? hat sich die denn in der betrachteten Zeit mehrfach verändert? Gruß ledum
|
|
Hallo Ledum,
vielen Dank für deine Antwort. Das Beispiel ist ein wenig abgewandelt aus einem Lehrbuch entnommen. Im Anhang ist die entsprechende Beschreibung zu finden.
Ich hatte das Ganze so verstanden, dass bei Gruppenfixen Effekten für ausgelassene Variablen kontrolliert wird, die über die Zeit konstant sind, sich aber unterschiedlich auf die einzelnen Gruppen (Bundesländer auswirken). Vielleicht habe ich das Beispiel im Lehrbuch auch nicht ganz verstanden und es falsch wiedergegeben
|
ledum 
22:43 Uhr, 08.02.2018
|
Hallo dein deutscher Text war schon sehr irritierend, schon allein weil Alkoholsteuern bei uns Bundes und nicht Ländersache sind. Aber was sind denn nun deine Fragen? der Text bei dem für mich eine Zwischenseite fehlt ist doch relativ klar? Gruß ledum
|
|
Hallo Ledum,
bitte entschuldige die Verwirrung, dass war tatsächlich nicht ganz eindeutig beschrieben. Ich habe noch einige Fragen zum allgemeinen Konzept der Regressionsanalyse mit Paneldaten und versuche im folgenden mein Verständnis dieses Konzepts so klar wie möglich zu beschreiben. Bitte korrigiere mich, falls ich etwas nicht richtig verstanden haben sollte.
Anhand des Beispiels im Buch soll - wie ja nun bekannt - untersucht werden, wie sich eine Biersteuer auf die Rate der Verkehrstoten auswirkt. Dazu liegen Daten zu den Verkehrstoten in jedem Staat in den USA im Zeitraum von sowie Daten zu den Biersteuern in jedem Staat für denselben Zeitraum vor.
Ich stelle mir also für jedes Jahr einen Scatterplot vor, wo auf der y-Achse die Rate der Verkehrstoten und auf der x-Achse die Höhe der Alkoholsteuer abgetragen ist. Ein Punkt steht jeweils für die Verkehrstoten-Rate eines Staates mit der entsprechenden Biersteuer in diesem Staat.
Um nun zu untersuchen welche Auswirkungen eine Biersteuer auf die Rate der Verkehrstoten in den USA hat, soll mit Hilfe von Paneldaten eine Regressionsanalyse durchgeführt werden. Zunächst sollen dafür Gruppenfixe Effekte verwendet werden, um die Einflüsse von nicht aufgenommenen Variablen (weil bspw. keine Daten zu diesen vorliegen) zu eliminieren und somit eine Verzerrung der Schätzer verhindern.
Das allgemeine Modell sieht dann so aus:
y_it Biersteuer_it u_it
Wobei alle nicht aufgenommenen Einflüsse beschreibt, die unterschiedlich auf die einzelnen Staaten aber relativ konstant über die Zeit wirken ( wie . die gesellschaftliche Stellung in den verschiedenen Staaten ggü. dem betrunkenen Auto fahren).
Nächster Schritt:
spiegelt nun meinen Gruppenfixen Effekt wieder und wird in die obige Gleichung eingesetzt.
y_it Biersteuer_it u_it
Für den Bundesstaat Texas sieht dann die Funktion . so aus: VerkehrstotenRate_Texas_1982 Biersteuer_Texas_1982 GruppenfixeEffekte (Die Gruppenfixen Effekte stellen das also den x-Achsenabschnitt meiner Regressionsgeraden dar)
Von dieser Gleichung gibt es dann für das Jahr noch weitere mit unterschiedlichen Achsenabschnitten (GruppenfixeEffekte)
Soweit habe ich das Konzept - vermutlich - verstanden. Nun verwirrt mich aber die Aussage, dass für jeden Staat ein eigener Achsenabschnitt geschätzt wird. Wenn ich mir wieder den Scatterplot für das Jahr vorstelle, mit der Rate der Verkehrstoten auf der y-Achse und der Biersteuer auf der x-Achse, habe ich nun also in diesem Scatterplot insgesamt verschiedene x-Achsenabschnitte und somit auch verschiedene Regressionsgeraden? Wie komme ich denn aber dann über Achsenabschnitte für das Jahr auf eine einzelne Regressionsgerade, die mir den allgemeinen Zusammenhang zwischen der Alkoholsteuer und den Verkehrstoten in den USA aufzeigt?
Bei den zeitfixen Effekten, die alle Staaten gleich treffen aber unterschiedliche über die Jahre sind habe ich dasselbe Problem:
y_it Biersteuer_it u_it mit als Effekte die unterschiedlich über die Jahre und gleich auf Staaten wirken (Fortschritt in der Sicherheitstechnik der Autos bspw.)
spiegelt nun meinen Zeitfixen Effekt wieder und wird in die obige Gleichung eingesetzt.
y_it Biersteuer_it u_it Regressionsgerade zur Schätzung mit zeitfixen Effekten.
Hier verstehe ich die Aussagen, dass für jedes Jahr ein unterschiedlicher Achsenabschnitt geschätzt wird, auch nicht. Bedeutet das, dass unter alleiniger Berücksichtigung von zeitfixen Effekten jeder Staat denselben x-Achsenabschnitt auf dem Scatterplott (Todesrate/Biersteuer) hat und nur unterschiedliche Steigungen aufweist? Und wenn ich nur mit gruppenfixen Effekten schätze, erhalte ich für jeden Staat einen unterschiedlichen Achsenabschnitt und unterschiedliche Steigungen?
Wenn ich nun also meine Gruppen- und zeitfixen Effekte verbinde erhalte ich folgendes Modell:
y_it = Biersteuer_it u_it
Ich erhalte also im Jahr für jeden Staat einen unterschiedlichen Achsenabschnitt. Dieser Ergibt sich aus den individuellen Gruppenfixen Effekten für jeden Staat und aus dem zeitfixen Effekt für das Jahr . Für die folgenden Jahre ändern sich die Achsenabschnitte der Staaten nur noch auf Grund der zeitfixen Effekte. Dies ergibt sich aus der Tatsache, dass die Gruppenfixen Effekte über die zeit konstant sind. Wenn ich das so korrekt verstanden habe frage ich mich abschließend nur noch, wie ich bei den ganzen Regressionsgeraden auf eine einzelne komme. Werden dann einfach durchschnitte der entsprechenden Schätzer gebildet?
Ich hoffe der Text ist nicht zu sehr ausgeartet. Ich wollte meine Fragen dieses mal so genau wie möglich erläutern.
Vielen Dank für deine Bemühungen
|
ledum 
17:10 Uhr, 10.02.2018
|
Hallo da sich die Biersteuer ja wohl nicht in einem Jahr ändert, kann ich mir nur vorstellen, dass man alle Jahre plottet um den Einfluß der Steuer zu sehen, da sie in verschiedenen staaten verschieden ist und due auch, bekoomt man verschiedene Plots pro Staat. die Steigung bedeutet jeweils die abhängigkeit von der Biersteuer, Wenn man jetz nur die Abh. von der Steuer rauskriegen will, muss man die Steigung der Geraden betrachten. steigt die zahl der toten obwohl die biesteuer gleich bleibt oder sinkt sie in einem Staat, mit steigender Biesteuer bleibt im anderen konstant, kann man wohl einfach nichts schließen, im besten Fall bekommt man in jedem Staat einen ähnlichen Zusammenhang und kann dann eine Gesamtanalyse machen, in der die anderen Einflüsse rausgerechnet sind. soweit mein Verständnis. Gruß ledum
|
|
Vielen Dank :-)
|