SODAS Lab

Das SODAS (Social Data Science) Lab verknüpft innovative Formen des Datenzugangs, der Datenaufbereitung und der Datenanalyse in der Forschung und der Lehre. Im Prozess der Digitalisierung verändern sich nicht nur gesellschaftliche Verhältnisse und soziale Formen. Vielmehr erzeugt der Einsatz digitaler Technik oftmals auch neuartige Datenformen bzw. digitale Datenquellen zu sozialen Prozessen, die bisher in dieser Form nicht verfügbar waren. Gleichzeitig eröffnen die Weiterentwicklungen von Statistiksoftware, insbesondere R und Python, hochinnovative Möglichkeiten zur Datenaufbereitung und zur Datenanalyse.

Gerade das Fach der Soziologie ist hier im besonderen Maße in der Lage auf die Entwicklungsdynamiken und das entstehende Methodenfeld, das oft auch „Data Science“ genannt wird, aufzunehmen. Im Sinne eines soziologisch-fundierten Forschungsansatzes, können diese methodischen und methodologischen Entwicklungen übergreifend als „Social Data Science“ gefasst und weiterentwickelt werden. Social Data Science beschreibt hier einen umfassenden methodischen, aber explizit auch methodologischen Ansatz, der die innovativen Methoden der „Data Science“ (Datenzugang, -aufbereitung und -auswertung) soziologisch fundiert und deren technischen Vorrausetzungen, als auch deren sozialen Folgen kritisch reflektiert.

Vor diesem Hintergrund bündelt das SODAS Lab einerseits die vielen unterschiedlichen Forschungsstränge, die sich mit innovativen Datenquellen und innovativen Auswertungsformen beschäftigen. Das umfasst insbesondere verschiedene Drittmittelprojekte mit sogenannten prozessproduzierten Daten, die beispielsweise durch das Statistische Bundesamt, aber auch direkt durch digitale Internetplattformen erzeugt werden. Die Auswertung dieser Datenquellen erlaubt qualitativ hochwertige Forschungsergebnisse, die in den unterschiedlichen Bereichen neuartige Erkenntnisse generieren werden.

Neben grundsätzlichen Fragen von Datenqualität und der Verknüpfung von „digitalen Daten“ mit sozialwissenschaftlichen Theorien („Methodologie“), bilden die Auswertung von georeferenzierten Daten (Geo-Daten) und die automatisierte Textanalyse (Topic Models) zentrale Schwerpunkte.

Schließlich werden diese innovativen Datenquellen mit etablierten Forschungsmethoden und kritischen Perspektiven verknüpft. Das bezieht insbesondere auch qualitative Fallstudienforschung und Interviewuntersuchungen als „Digital-Mixed-Methods“ mit ein. Dabei werden innovative Forschungsdesigns mit klassischen qualitativen Methoden verbunden eingesetzt. Darüber hinaus werden die qualitativen Methoden mit neuartigen KI-gestützten Methoden verknüpft, wie beispielsweise KI-basierte Transkription von Interviews und KI-assistierte Kodierung von Interviews.

Andererseits integriert das Lab die Forschungsstränge mit Lehrveranstaltungen. Die Datenquellen und Analysemethoden werden systematisch in Lehrveranstaltungen eingesetzt, um die Studierenden frühzeitig an praktische Probleme des Datenzugangs und der Datenaufbereitung heranzuführen. Die Forschungsprojekte können hier dazu dienen, die Möglichkeiten der innovativen Methoden zu veranschaulichen und den Studierenden anhand konkreter Anwendungsbeispiele aus der Forschung die erforderlichen Analysekompetenzen und deren Relevanz zu vermitteln. Das umfasst auch die Vermittlung von neuartigen Ansätzen, wie KI-basierte Transkription und KI-assistierte Kodierung.

Aktuelle Projekte

Spielen die Hochschulen eine Rolle? Panelanalysen zu den Entwicklungen der Professorinnenanteile an deutschen Hochschulen von 1993 bis 2020

Tarifpolitik in der Transformation