Differenz-in-Differenzen (DiD)

Die Differenz-in-Differenzen-Schätzung ist eine quasi-experimentelle Methode der Wirkungsevaluierung, die es erlaubt, zeitlich konstante Unterschiede in unbeobachtbaren Variablen zu kontrollieren. Die Methode lässt zu, dass Unterschiede zwischen Kontroll- und Behandlungsgruppen bestehen können (z. B. unterschiedliche Durchschnittswerte des sozioökonomischen Status). Durch die Kombination von Vorher-Nachher- und einfacher Differenzanalyse behebt DiD die Mängel beider Ansätze, wie z. B. Reifeverzerrungen oder Selektionsverzerrungen, die sich aus zeitlich konstanten, unbeobachtbaren Variablen ergeben.

Ein wesentlicher Nachteil von DiD im Vergleich zu kontrollierten Designs wie RCTs ist jedoch die Abhängigkeit von einer gemeinsame Trendannahme. Diese Annahme setzt voraus, dass die Behandlungseinheiten und die Vergleichseinheiten ohne die Intervention im Laufe der Zeit dieselbe Entwicklung durchlaufen hätten. Die Annahme eines gemeinsamen Trends ist vielen Gefahren ausgesetzt und kann leicht verletzt werden. Selbst wenn die beiden Gruppen zu Beginn ähnlich aussehen, zumindest in Bezug auf die beobachtbaren Variablen, gibt es keine Garantie dafür, dass sie sich im Laufe der Zeit ähnlich entwickeln, da einige störende Faktoren eine Rolle spielen können. Wenn die DiD beispielsweise auf der Grundlage von sich geografisch nicht überschneidenden Kontroll- und Behandlungsgruppen konzipiert ist, besteht das Risiko, dass einige unvorhergesehene Ereignisse nur eine der beiden Gruppen betreffen. Im Zuge der Umsetzung eines Bildungsprogramms könnten beispielsweise Schulen der Behandlungsgruppe durch andere staatliche Bildungsprogramme positiv beeinflusst werden, was zu einer Verzerrung der Wirkungsschätzungen führt. Ebenso kann eine Naturkatastrophe wie eine Überschwemmung oder ein Erdbeben dazu führen, dass die Schulen der Behandlungsgruppe für mehrere Monate geschlossen werden, was sich negativ auf die schulischen Ergebnisse auswirkt. Zusammenfassend lässt sich sagen, dass die Existenz eines unbeobachtbaren Faktors, der sich im Laufe der Zeit ungleich auf die beiden Gruppen auswirkt, kaum ausgeschlossen werden kann, es sei denn, die Schulen werden nach dem Zufallsprinzip wie in einem RCT-Design ausgewählt. Daher ist es schwierig, die Annahme eines gemeinsamen Trends, auf die sich DiD stützt, zu validieren, wenn nicht mehrere Zeiträume zur Verfügung stehen.