Beschreibung
Das Lehrbuch zur Programmiersprache R mit Videos und Musterlösungen ist der ideale Einstieg für Studierende in die Statistik mit den Schwerpunkten moderne Ökonometrie, empirische Kausalanalyse und Machine Learning. utb+: Begleitend zum Buch stehen Leser:innen für den schnellen Einstieg in R zwei YouTube-Lernvideos zur Verfügung. Ferner sind für alle Lernziele in R einschlägige Programmierbeispiele über GitHub zugänglich. Erhältlich über utb.de.
Autorenportrait
Prof. Dr. Dennis Klinkhammer ist Fachhochschuldozent an der FOM Hochschule für Empirische Sozialforschung und Wissenschaftler am Institut für Empirie & Statistik (ifes). Er lehrt und forscht zur Anwendung von quantitativen Methoden und Machine Learning in den Sozialwissenschaften.
Inhalt
Schnelleinstieg in R 7
Teil 1: Grundlagen der Forschungsmethoden 9
1 Einführung in die Forschungsmethoden 9
2 Ziele der empirischen Forschung 12
3 Grundlegende Begriffe und Definitionen 14
Forschungsfragen und Hypothesen 14
Operationalisierung zur Beantwortung von Hypothesen 16
Variablen und Konstanten in Datensätzen 17
Skalenniveaus 20
4 Wissenschaftliche Gütekriterien 23
Objektivität 23
Reliabilität 24
Validität 24
5 Daten als Grundlage der Analyse 27
Datengenerierung 27
Stichprobenziehung 28
Herausforderungen der Datengewinnung 32
Teil 2: Quantitative Datenanalyse 39
6 Deskriptive Analyse 39
Beispieldatensatz für die deskriptive Analyse 39
Lagemaße der deskriptiven Statistik 40
Minimum, Maximum sowie weitere Lagemaße 43
Boxplot zur grafischen Darstellung von Verteilungen 45
Verteilung der Merkmalsausprägungen 47
Varianz und Standardabweichung 51
Vergleich von z-Werten 56
7 Bivariate Analyse 58
Beispieldatensatz für die bivariate Analyse 58
Empirische Kovarianz 60
Korrelationskoeffizienten 61
Bivariate Datenstruktur visualisieren 66
Chi-Quadrat-Test 68
t-Test 72
8 Multivariate Analyse 77
Beispieldatensatz für die multivariate Analyse 78
Deskriptive und bivariate Analyse vor der multivariaten Analyse 79
Grundlagen der linearen Regressionsanalyse 81
Einfache lineare Regression 82
Multiple lineare Regression 86
Zusammenfassung der Voraussetzungen für lineare Regressionsanalysen 92
Grundlagen der logistischen Regressionsanalyse 93
Teil 3: Empirische Kausalanalyse 99
9 Das fundamentale Evaluationsproblem und kausale Effekte 99
10 Randomisierte Experimente zur Lösung des fundamentalen Evaluationsproblems 102
Einführung in randomisierte Experimente 102
Identifizierungsstrategie bei randomisierten Experimenten 111
11 Lösung des fundamentalen Evaluationsproblemsbei fehlender Randomisierung 115
Kontrollvariablen in der Regressionsanalys 115
Praxisbeispiel: Evaluation eines Weiterbildungsprogramms ohne Randomisierung 118
12 Erster Lösungsansatz: Regression Discontinuity Design 120
Grundidee des 120
Kausaler Effekt eines fiktiven Weiterbildungsprogramms 121
RDD Praxisbeispiel 122
13 Zweiter Lösungsansatz: Differenz-von-Differenzen-Schätzung 125
Grundidee des Designs 125
DiD und Regressionsmethode 126
DiD-Regressionsmodelle in R 127
Grenzen der DiD-Methode 129
14 Dritter Lösungsansatz: Instrumentvariablen-Schätzung 133
Grundidee des Designs 133
Mincer-Gleichung in R 134
Diskussion der identifizierenden Annahme 137
Instrumentvariablenschätzung und 2SLS 137
15 Wichtige Konzepte und Unterscheidungen 141
Arten von Experimenten 141
Arten von kausalen Effekten 142
Messung von Effekten 146
Teststärke 147
Externe Validität 148
Ausblick 149
Teil 4: Machine Learning 151
16 Einführung in das Machine Learning 151
17 Statistische Formeln als Grundlage des Machine Learnings 153
Datenaufbereitung und Modellierung 153
Training und Validierung 154
18 Anwendung von Machine Learning-Algorithmen 158
Beispieldatensatz für das Machine Learning 158
Supervised Machine Learning 163
Unsupervised Machine Learning 171
Teil 5: Weitere Materialien 179
Video-Tutorials (YouTube) 179
Programmierbeispiele (GitHub) 181
Ausgewiesene Literaturempfehlungen 182
Sachwortverzeichnis 185