14440 Causal Data Science

Lernziele

Die Studierenden haben ein grundlegendes Verständnis von Datenanalyse in Verbindung mit der Identifizierung kausaler Zusammenhänge. Sie sind vertraut mit einer verbalen und grafischen Ausdrucksweise. Sie sind vertraut mit den Schlüsselkonzepten der Kausalität, wie beispielsweise Counterfactuals, Outcome-Equivalence, und Confounding Effects. Sie kennen typische Problemklassen, die keine kausalen Interpretationen der beobachteten Zusammenhänge zulassen, sowie typische Lösungen für diese Probleme mit Hilfe von Datenanalyse- und Datenerhebungsmethoden. Darüber hinaus verstehen die Studierenden die enge Interdependenz von Datenanalytik und Datenerhebungsdesign, um qualitativ hochwertige Evidenz und qualitativ hochwertige Vorhersagen zu generieren.

Inhalte

  1. Kontrafaktische und potenzielle Ergebnisse, Kausaldiagramme und typische Probleme (d.h. vernachlässigte relevante Variablen, Messfehler, umgekehrte Kausalität, endogene Selektion, endogene Treatments)
  2. Datenanalytische Lösungen: Kontrollvariablen, Matching, Gewichtung
  3. Datenanalytische Lösungen: Instrumentalvariablen, Selektionsinstrumente
  4. Lösungen für die Datenerhebung: Reale Experimente
  5. Angenommene Experimente als gemischte Lösungen: natürliche Experimente, Quasi-Experimente, Regression Diskontinuität 
  6. Zeitreihendaten als gemischte Lösung: diff-in-diff und verwandte Methoden
  7. Überlegungen zu Moderations- und Mediationsanalysen bzw. Strukturgleichungsmodellierung

Der Schwerpunkt des Moduls liegt auf Anwendungen in den Wirtschaftswissenschaften, aber die zugrunde liegenden Theorien und Methoden sind über diese Bereiche hinaus verallgemeinerbar. Der Kurs ergänzt traditionellere Data-Science-Module, die einen stärkeren Fokus auf die Implementierung von datenwissenschaftlichen Algorithmen legen. In den Übungen werden diese Methoden auch auf die Analyse von realen Problemen mit simulierten und realen Datensätzen angewendet. Aktuell wird in den Praxisteilen der Übung die frei verfügbare Software [R] verwendet.

Die vollständige Beschreibung des Moduls finden Sie hier.