1 Übersicht

Das Sozio-Oekonomische Panel (SOEP) ist eine Längsschnittstudie am Deutschen Institut für Wirtschaftsforschung (DIW Berlin), die beginnend im Jahr 1984, eine jährliche Befragung von Haushalten und deren Haushaltsmitgliedern in Deutschland durchführt. Somit können anhand von Daten des SOEP Verläufe und Veränderungen durch externe Einflüsse sehr gut beschrieben und analysiert werden. Im Frühjahr 2020 wurden die SOEP Haushalte neben der regulären, persönlichen Befragung zusätzlich telefonisch (d.h. in einem CATI) zu ihren Erfahrungen durch die Corona-Krise befragt. Weitere Informationen zum Design und der Inhalte der SOEP-CoV-Studie bieten Kühne et al. (2020). Die Ergebnisse und Spotlights der Studie werden unter www.soep-cov.de gesammelt.

Der zuletzt veröffentlichte Scientific Use File (SUF) des SOEP in der Version 35 umfasst die Erhebungsjahre von 1984 bis einschließlich 2018. Die Daten aus dem Erhebungsjahr 2019 liegen der SOEP Abteilung im DIW Berlin ebenfalls vor, sind allerdings noch nicht aufbereitet und veröffentlicht. Aufgrund von Zuzügen zu und Auszügen aus Haushalten, ebenso wie durch Geburten neuer Personen in den Haushalt und das Sterben von Haushaltsmitgliedern verändert sich die Zusammensetzung der Haushalte über die Zeit. Zudem ist es möglich, dass Haushalte oder einzelne Haushaltsmitglieder in einem Erhebungsjahr ihre Teilnahme aussetzen. Aufgrund all dieser Veränderungen in Haushaltsstrukturen, werden für die SOEP-CoV-Studie diejenigen Haushalte ausgewählt, die in den Erhebungsjahren 2018 und 2019 mindestens an einer Erhebung teilgenommen haben und bis zum Feldbeginn 2020 nicht explizit ihre Teilnahme verweigert haben. Von den verbleibenden Haushalten werden darüber hinaus folgende Haushalte ausgeschlossen:

Haushalte der Geflüchteten-Stichproben M3, M4 und M5. Diese werden im Rahmen einer gesonderten Befragung unter der Verantwortung des Instituts für Arbeitsmarkt und Berufsforschung (IAB) telefonisch zu ihren Erfahrungen in der Corona-Krise befragt.
Haushalte der Stichproben, die 2019 erstmals befragt wurden (d.h. die Teilstichproben P und Q), um deren Teilnahmebereitschaft an der regulären 2. Welle nicht zu gefährden.
Haushalte der sogenannten “zentralen Bearbeitung”. Die “zentrale Bearbeitung” des SOEP Erhebungsinstituts (Kantar Public) kümmert sich um Haushalte, die über die üblichen Kontaktwege des SOEP (nämlich über Interviewer) nicht kontaktiert werden wollen oder können. Die Befragten der “Zentralen Bearbeitung” werden in der Regel telefonisch kontaktiert und füllen den Fragebogen selbständig oder telefonisch assistiert aus. Somit handelt es sich bei den zentral bearbeiteten Haushalten um Haushalte, die bereits im Rahmen der regulären SOEP Befragung eine große Neigung der Nichtteilnahme zeigen. Diese Haushalte sollen durch Sonderbefragungen nicht zusätzlich belastet werden.
Haushalte ohne gültige Telefonnummer, da diese im Rahmen der SOEP-CoV-Studie nicht telefonisch befragt werden können.

Die Stichprobe der verbleibenden Haushalte wurde hinsichtlich ihrer Zusammensetzung und der Kontaktinformationen durch das Erhebungsinstitut des SOEP auf den Zeitpunkt März 2020 aktualisiert und als Bruttostichprobe für die CoV-Studie an das SOEP zurückgespielt. Diese wurde zufällig auf insgesamt neun Tranchen verteilt. Diese werden zeitlich aufeinander folgend befragt. Dabei sind die Tranchen so konstruiert, dass ihre Stichprobengröße über die Zeit abnimmt. Dieser Ansatz hat der Tatsache Rechnung getragen, dass die Menschen in Deutschland in den ersten Wochen des kompletten Lockdowns (und somit während der Feldzeit der ersten vier Tranchen) den größten Herausforderungen und somit Änderungen im alltäglichen Leben gegenüberstanden.

Die ersten vier Tranchen sind die größten mit einem Befragungszeitraum von jeweils zwei Wochen. Die restlichen fünf Tranchen fallen kleiner aus und ihr Befragungszeitraum erstreckt sich auf eine Woche. Einzelne Interviews konnten erst mit einigen Tagen Verzögerung realisiert werden, so dass die tatsächlichen Befragungszeiträume zwischen den Tranchen nicht disjunkt sind. Die Befragungszeiträume und Stichprobenumfänge sind in Tabelle 1.1 nach den einzelnen Tranchen ausgewiesen.

Tabelle 1.1: Befragungszeiträume und Stichprobenumfänge nach Tranchen.
	Befragungszeitraum		Status der Haushalte in der Stichprobe
Tranche	Feldstart	Feldende	Eingesetzt	Erreicht	Realisiert
1	01.04.2020	18.04.2020	2.756	2.068	1.689
2	14.04.2020	02.05.2020	3.296	2.450	1.932
3	27.04.2020	16.05.2020	1.767	1.310	978
4	11.05.2020	30.05.2020	1.183	871	632
5	25.05.2020	06.06.2020	608	443	309
6	02.06.2020	13.06.2020	629	450	303
7	08.06.2020	20.06.2020	578	409	288
8	15.06.2020	27.06.2020	598	433	298
9	22.06.2020	04.07.2020	584	405	265
1-9	01.04.2020	04.07.2020	11.999	8.839	6.694

Der Feldstart der SOEP-CoV-Studie war am 1. April 2020 und der letzte Tag der Befragung von Tranche 9 war am 4. Juli 2020. In den Tranchen 1 bis 9 wurden 11.999 Haushalte eingesetzt, wovon 8.839 Haushalte telefonisch erreicht werden konnten und schließlich 6.694 an der SOEP-CoV-Studie teilgenommen haben.

Eine grafische Aufbereitung der Stichprobenumfänge nach Status (Kontaktierbarkeit sowie Teilnahmebereitschaft) und Tranchen findet sich in Abbildung 1.1. Der linke Teil der Abbildung zeigt dabei Verteilung nach Tranche Kontakt- bzw. Teilnahmestatus in absoluten Fallzahlen, der rechte Teil in Anteilen.

Der rechten Abbildung ist zu entnehmen, dass der Anteil der teilnehmenden Haushalte im Zeitverlauf leicht, aber stetig, gesunken ist. (Hier liegt die Vermutung nahe, dass das anfänglich große Interesse in der Bevölkerung am Thema “Corona” über Zeit abgenommen hat.) Der Anteil an Haushalten, die nicht erreicht werden konnten, ist über die Tranchen hinweg indes nahezu unverändert.

Abbildung 1.1: Einsatzstichproben nach Tranche und Status.

2 Ablauf der SOEP-CoV-Gewichtung

Die Gewichtung der SOEP-CoV-Studie verlief in weiten Teilen analog zur Gewichtung des SOEP-Core. Diese wird detailliert von Kroh, Siegers, and Kühne (2015) beschrieben und ist für die aktuelle Version 35 dokumentiert in Siegers, Belcheva, and Silbermann (2020).

Als Ausgangsgewicht für die Gewichtung der Haushalte in der SOEP-CoV-Studie diente das Haushaltsgewicht (hhrf) ihrer letzten realisierten Befragung bis 2018, also in der Regel der SOEP-Welle bi (aus der SOEP SUF Version v35). Dieses wurde für die Haushalte der SOEP-CoV-Studie für aufeinanderfolgende Ausfallschritte auf Haushaltsebene adjustiert und bezüglich verschiedener Populationsverteilungen, die dem Mikrozensus 2018 entnommen wurden, randangepasst.

Ausgehend von diesen Haushaltsgewichten wurden über einen weiteren Randanpassungsschritt Gewichte für alle Personen in den teilnehmenden Haushalten generiert. Für diejenige Person des Haushalts, die an der CATI-Befragung teilgenommen hat, wurde ein weiterer Gewichtungsschritt durchgeführt, der auftretende Selektionseffekte korrigiert.

Die nachfolgende Abbildung 2.1 zeigt schematisch den Ablauf der Gewichtung. Konkret wurden in einem ersten Schritt die Ausgangsgewichte für die Veränderungen zwischen der Zusammensetzung des SOEP im Jahr 2018 und 2020 korrigiert. In diesem Zusammenhang wurden die 2018er SOEP Haushaltsgewichte angepasst um Zugänge zu (Zuzug in bestehende Haushalte, Neugeborene) und Abgänge (Verstorbene, Verweigerer) aus der Stichprobe.

Im darauffolgenden Schritt wurde für die Haushalte korrigiert, die von vornherein von der Teilnahme an der SOEP-CoV-Studie ausgeschlossen waren (siehe Abschnitt 1).

Abbildung 2.1: Schematischer Ablauf der Gewichtung für die SOEP-CoV-Studie (HH: Haushalte.).

Für eine zeitnahe Verwendung der Daten wurde die Stichprobe der SOEP-CoV-Studie nach Abschluss bestimmter Tranchen jeweils gemeinsam gewichtet. Hierbei wurde der tranchenweise Einsatz berücksichtigt und die Haushalte jeweils auf die Grundgesamtheit hochgerechnet. Insbesondere der Einsatz der Teilstichproben M1 und M2 (Migrationsstichproben), der erst ab der zweiten Tranche stattfand, fand in diesem Schritt Berücksichtigung.

Um eine möglichst heterogene Zahl von verschiedenen Haushaltsmitgliedern zu erreichen, wurden alle Haushalte zu verschiedenen Tageszeiten von 7 Uhr morgens bis 21 Uhr abends angerufen. Generell wurde auch davon ausgegangen, dass aufgrund der Ausgangsbeschränkungen und des erhöhten Anteils an Personen, die durch die Krise im Home Office arbeiteten, Befragungspersonen telefonisch besser zu erreichen sind als vor der Krise. Die entsprechende Verteilung der Anrufe nach Wochentag, Uhrzeit und Anschluss ist in Abbildung 2.2 dargestellt. Dennoch verbleiben zwischen 25 und 31 Prozent der Haushalte, die im jeweiligen Befragungszeitraum nicht erreicht werden konnten (vgl. hierzu Abbildung 1.1 weiter oben). Im dritten Schritt der Gewichtung wurde daher für die Kontaktierbarkeit der Haushalte innerhalb der jeweiligen Befragungszeiträume korrigiert.

Abbildung 2.2: Anzahl der Anrufe nach Uhrzeit, Wochentag und Anschluss.

Im vierten Schritt wurde schließlich für die Bereitschaft der Haushalte korrigiert, an der SOEP-CoV-Befragung teilzunehmen. Für die SOEP-CoV-Studie konnten innerhalb der einzelnen Tranchen zwischen 69 und 75 Prozent der eingesetzten Haushalte erreicht werden. Über die Tranchen 1 bis 9 hinweg wurden 73 Prozent erreicht. Von den erreichten Haushalten konnten innerhalb der einzelnen Tranchen zwischen 65 und 82 Prozent der Haushalte realisiert werden. Über die Tranchen 1 bis 9 hinweg wurden 72 Prozent realisiert. Somit ergibt sich eine Response Rate nach AAPOR (The American Association for Public Opinion Research 2016) von RR1 = 0,558. Innerhalb der einzelnen Tranchen schwankt sie zwischen 0,454 und 0,613. Diesem Schritt folgt eine Randanpassung auf eine Vielzahl an Populationsverteilungen, siehe Abschnitt 5, der die Gewichtung auf Haushaltsebene abschließt.

Anschließend wurden auf Basis der Haushaltsgewichte über einen weiteren Randanpassungsschritt Hochrechnungsfaktoren für die einzelnen Haushaltsmitglieder erstellt. Das Verfahren und die hierfür verwendeten Randverteilungen sind im Abschnitt 5 genauer beschrieben.

Auf Basis dieses Personengewichts erzeugen wir in einem letzten Schritt Hochrechnungsfaktoren für die auskunftgebende Person eines teilnehmenden Haushalts. In diesem Schritt wird für die selektive (Selbst-)Auswahl der Auskunftsperson bei Haushalten mit mindestens zwei Erwachsenen korrigiert.

3 Merkmale für die Gewichtung

In die Ausfallmodelle (cloglog Regressionen) der SOEP-CoV-Gewichtung gingen über 400 Merkmale auf Haushalts- und Personenebene ein. Der Großteil der Merkmale entstammt den vorangegangenen Wellen der Paneldaten des SOEP. Insgesamt flossen Variablen aus zahlreichen Befragungsgebieten des SOEP ein wie beispielsweise Demographie, Arbeit, Gesundheit, Bildung, Familie, Finanzen, Persönlichkeit, Migration oder auch politische Einstellung. Zudem wurden in den Ausfallmodellen, soweit sinnvoll und möglich, Personenmerkmale aggregiert auf Haushaltsebene berücksichtigt. Eine Liste mit Merkmalen, die für die Gewichtung des SOEP-Core Version 35 verwendet wurden findet sich in Siegers, Belcheva, and Silbermann (2020 S. 63f, 70ff).

Auch Informationen über den Kontaktverlauf gingen in die Gewichtung ein. Von Seiten des Erhebungsinstitutes wurden dem SOEP für insgesamt 86.069 Anrufe die Kontaktprotokolle der Telefonverläufe zur Verfügung gestellt. Diese umfassen Informationen zu erfolgreichen und erfolglosen Kontaktversuchen. Zusätzlich enthalten sie Informationen zu Datum und Uhrzeit eines Kontaktversuchs, ob über eine Festnetz- oder Mobiltelefonnummer angerufen wurde und den Rücklaufcode zu dem jeweiligen Kontaktversuch. Aus diesen Informationen haben wir weitere Variablen gebildet, die bspw. angeben, über welchen Telefonanschluss (Festnetz, Mobiltelefon, beide) ein Haushalt kontaktiert wurde oder wie oft ein Haushalt zu bestimmten Tageszeiten kontaktiert wurde.

Des weiteren wurden die jeweils tagesaktuellen Corona-Fallzahlen (Anzahl der Erkrankten, Verstorbenen, Genesenen) auf Kreisebene zum Tag des Kontaktversuchs bzw. Interviews verwendet. Die entsprechenden Daten werden vom Robert Koch-Institut öffentlich zugänglich gemacht.¹ Mit Hilfe der vom Statistischen Bundesamt bereitgestellten Bevölkerungszahlen auf Kreisebene wurde zusätzlich zu den obigen Größen die Corona-Inzidenz auf Kreisebene berechnet.² Auch diese Inzidenz war Teil der Gewichtungsvariablen.

Ebenso flossen kleinräumige Informationen unterhalb der Kreisebene, überwiegend zur Sozialstruktur von Nachbarschaften, in die Ausfallmodellierung ein. Entsprechende Daten werden von Microm bereitgestellt.

Tabelle A.1 in Anhang A fasst alle Variablen zusammen, die in den verschiedenen Ausfallmodellen auf ihren Einfluss hinsichtlich einer Einschluss in die Stichprobe, Erreichbarkeit oder Teilnahme hin geprüft wurden.

Nicht alle Variablen fließen in jedes Ausfallmodell ein. Der Grund hierfür ist offensichtlich: unter den über 400 verfügbaren Merkmalen haben erwartungsgemäß viele keinen Einfluss auf die zu erklärende Variable (d.h. die Einschluss in die Stichprobe, die Kontaktierbarkeit oder die Teilnahme) und/oder sind miteinander hoch korreliert. Nimmt man unnötig viele erklärende Variablen in ein Modell auf, erzeugt dies eine große Streuung in den zu erzeugenden Gewichtungsfaktoren (die sich aus dem Inversen der vorhergesagten Einschluss-, Kontakt- und Teilnahmewahrscheinlichkeiten ergeben). Dies sollte aus Gründen der Stichprobeneffizienz in jedem Fall vermieden werden.

Daher wurden vor jeglicher multivariaten (Ausfall-)Modellierung alle Variablen einzeln auf ihren Zusammenhang mit der zu erklärenden Variable (d.h. Einschluss in die Stichprobe, Kontaktierbarkeit und Teilnahme) geprüft. Nur wenn dieser Zusammenhang signifikant (p<0.05) war, wurde die entsprechende Variable in die vorläufige Menge der erklärenden Variablen für das entsprechende Ausfallmodell aufgenommen. Aus Gründen der Modelleffizienz wurden aus der Menge der erklärenden Variablen zudem noch stark korrelierte Merkmale ausgeschlossen. Hierfür wurde die Korrelation aller erklärenden Variablen untereinander bestimmt. Von Merkmalen, die eine betragsmäßige Korrelation von größer als 0,95 aufwiesen, floss nur jenes in das Ausfallmodell ein, das den größten (signifikanten) Einfluss auf die zu erklärende Variable (d.h. die Einschluss in die Stichprobe, die Kontaktierbarkeit oder die Teilnahme) hatte. So ergaben sich für die verschiedenen Ausfallmodelle unterschiedliche Mengen an erklärenden Variablen.

In einem letzten Schritt fand nun noch eine Variablenselektion anhand des bayesianischen Informationskriteriums (BIC) statt. Hierbei wurden dem jeweiligen Modell iterativ Variablen entnommen bzw. wieder hinzugefügt, wenn diese Veränderung im Modell zu einem niedrigeren BIC und somit zu einer besseren Modellgüte führte. Dieses hier beschriebene dreistufige Verfahren zur Variablenselektion fand für jedes der Ausfallmodelle Anwendung, die im Rahmen der SOEP-CoV-Gewichtung geschätzt wurden.

4 Geschätzte Gewichtungsmodelle

Dieser Abschnitt präsentiert die Modelle, die für die oben aufgeführten Gewichtungsschritte geschätzt wurden.³ Die Ergebnisse werden in Form von Koeffizientenplots präsentiert. Auf der y-Achse sind die Merkmale abgetragen, die als erklärende Variablen in das jeweilige Gewichtungsmodell eingeflossen sind. Parallel zur x-Achse sind die Werte der geschätzten Koeffizienten (roter Punkt) samt ihres 95%-Konfidenzintervalls (rote Balken mit vertikalen Enden) dargestellt. Die gestrichelte, vertikale Linie markiert den Wert 0. Die geschätzten Koeffizienten sind dabei vom kleinsten (oben links) hin zum größten (unten rechts) sortiert. Merkmale, deren Koeffizientenschätzer links der grau gestrichelten Linie liegen, weisen auf einen negativen Einfluss hin. Merkmale, deren Koeffizientenschätzer rechts der grau gestrichelten Linie liegen weisen auf einen positiven Einfluss hin.⁴

4.1 Ausfälle zwischen 2018 und der Bruttostichprobe SOEP-CoV

Abbildung 4.1 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wurde, um für die Ausfälle zwischen der 2018er SOEP-Welle bi und der Bruttostichprobe an Haushalten im Jahr 2020 zu korrigieren. Wir finden, dass die Nichtteilnahme im Erhebungsjahr 2018 einen deutlich negativen Effekt auf die Bleibewahrscheinlichkeit im SOEP 2020 hat. Weiter beeinflussen der Einsatz von Übersetzungshilfen in den Migrationsstichproben im Rahmen der letzten Erhebung sowie die Zugehörigkeit zur den Migrationsstichproben M1 und M2 die Teilnahmebereitschaft negativ. Haushalte mit sehr jungen Haushaltsmitgliedern weisen ebenso wie Haushalte mit alten Haushaltsvorständen eine deutlich geringere Bleibewahrscheinlichkeit auf.⁵ Auch das Nichtvorhandensein eines Internetanschlusses im Haushalt wirkt sich negativ aus auf die Wahrscheinlichkeit im SOEP zu verbleiben. Lebt mindestens eine Person im Haushalt, die angibt besonders heimatverbunden zu sein, findet sich ein negativer Effekt auf die Bleibewahrscheinlichkeit. Das Gleiche gilt für Merkmale, die in Bezug zu fehlenden Werten (konkret: partial unit nonrespone und ein hoher Anteil an item nonresponse auf Haushaltsebene) stehen. Schließlich wirkt sich auch der Umstand, dass das letzte Interview spät in der Feldphase durchgeführt wurde, negativ auf den Verbleib im SOEP aus.

Positiv auf die Bleibewahrscheinlichkeit wirken sich hingegen das Vorhandensein einer Parteipräferenz sowie ein starkes politisches Interesse bei mindestens einem Haushaltsmitglied aus. Ebenfalls positiv wirkt es sich aus, wenn eine der Personen im Haushalt ledig oder mindestens eine Person im Haushalt einen systemrelevanten Job hat. Haushalte, in denen zwei Erwachsene ohne Kinder leben und Haushalte in denen in der letzten Erhebung das Zusatzinstrument für die Mutter-Kind-Befragung ausgefüllt wurde haben eine höhere Wahrscheinlichkeit im SOEP zu verbleiben als Haushalte mit mehr als 2 Personen in denen keine Kinder leben und Haushalte, in denen dieses Instrument nicht ausgefüllt wurde. Angehörige der Teilstichproben L3, die zum Zeitpunkt der Ziehung nur die Familientypen Alleinerziehende und Mehrkindfamilien enthielten, haben ebenfalls eine höhere Bleibewahrscheinlichkeit.

Abbildung B.1 in Anhang B zeigt die vom Modell geschätzten Bleibewahrscheinlichkeiten.

Abbildung 4.1: Koeffizientenplot des Modells zur Korrektur von Ausfällen zwischen der Befragung 2018 und der SOEP-CoV-Studie. (HH: Haushalt.)

4.2 Tranchenweise eingesetzte Fälle

Für die Befragung im Rahmen der SOEP-CoV-Studie kamen nur Haushalte in Frage, für die eine aktuelle Telefonnummer vorlag und die zuletzt nicht durch die “zentrale Bearbeitung” des Erhebungsinstituts betreut wurden, siehe Abschnitt 1. Die (potentielle) selektive Verzerrung des Ausgangsbrutto für SOEP-CoV im Vergleich zur SOEP Stichprobe 2018 wird im folgenden Modell (anhand von Informationen aus der SOEP Befragung 2018) untersucht und quantifiziert.

Abbildung 4.2 zeigt die geschätzten Koeffizienten und deren 95%-Konfidenzintervalle für das zugehörige Ausfallmodell mit cloglog-Link. Auch in diesem Fall sind die Merkmale, deren Koeffizientenschätzer links der grau gestrichelten Linie liegen, relativ weniger im Ausgangsbrutto von SOEP-CoV vorhanden als im Gesamt-SOEP. Die Nichtteilnahme an der SOEP-Erhebung im Jahr 2018 ebenso wie Haushalte mit jungen (jünger als 35 Jahre) Haushaltsvorständen, sind relativ weniger im Ausgangsbrutto enthalten. Gleiches gilt für Haushalte, aus denen mindestens eine Person seit 2018 ausgezogen ist und Haushalte in Ostdeutschland (Haushalte in Thüringen und Sachsen-Anhalt und Haushalte der Teilstichprobe C, welche das Ausgangs-Sample für Haushalte Ostdeutschland aus dem Jahr 1990 bildet). Ein hohes Niveau an Item Nonresponse auf Haushalts-, wie auch auf Personenebene, führt zu einer geringeren Wahrscheinlichkeit. Auch die Zugehörigkeit zu den Teilstichproben A (Ausgangs-Sample Westdeutschland; 1984) und O (Haushalte in Gebieten der Sozialen Stadt; 2018) führt zu einer niedrigeren Wahrscheinlichkeit im Ausgangsbrutto zu verbleiben. Schließlich sind auch Haushalte mit zwei Erwachsenen ohne Kinder und ‘andere’ Haushaltszusammensetzungen relativ weniger wahrscheinlich. Schließlich wirkt sich auch die Unzufriedenheit mit dem Familienleben negativ auf den Verbleib im Ausgangsbrutto aus.

Relativ häufiger hingegen wurden Haushalte eingesetzt, in denen mindestens eine Person mehr als 3 Stunden Freizeit werktags hat, deren ältestes Haushaltsmitglied älter als 65 Jahre ist, in denen mindestens eine Person selbstständig ist, deren Haushaltsvorstand älter als 74 Jahre ist und deren Haushaltsvorstand zum Zeitpunkt der Stichprobenziehung noch nicht im Haushalt lebte. Ebenfalls überproportional im Ausgangsbrutto der Stichprobe enthalten sind Haushalte, bei denen das Interview der letzten Befragung besonders lang (4. Quartil der Verteilung der Befragungsdauer) oder kurz (1. Quartil der Verteilung der Befragungsdauer) gedauert hat. Ebenfalls häufiger im Ausgangsbrutto verblieben sind Haushalte der Teilstichproben J (Aufstockung aus dem Jahr 2011), K (Aufstockung aus dem Jahr 2012), Teilstichproben aus den Jahren 2010 und 2011 mit Fokus auf unterschiedliche Familientypen L1 (Geburtskohorten von 2007 bis 2010), L2 (Niedrigeinkommen, Alleinerziehend, Mehrkindfamilien) und L3 (Alleinerziehend, Mehrkindfamilien). Gleiches gilt für die Migrationsstichproben M1 aus 2013 und M2 aus dem Jahr 2015, sowie für die Teilstichprobe N (Aufstockung aus dem Jahr 2017).

Abbildung B.2 in Anhang B zeigt die vom Modell geschätzten Wahrscheinlichkeiten für den Einsatz in der SOEP-CoV-Studie.

Abbildung 4.2: Koeffizientenplot des Modells zur Korrektur des designbedingten Verzichts auf Haushalte der “zentralen Bearbeitung” oder ohne bekannte Telefonnummer. (HH: Haushalt.)

4.3 Telefonische Erreichbarkeit der Haushalte

Im Gegensatz zur bisherigen Befragung des SOEP, die für gewöhnlich mittels eines persönlichen computergestützten (CAPI) oder schriftlichen (PAPI) Interviews durchgeführt wird, wurde diese Studie als telefonische Umfrage (CATI) durchgeführt. Hierbei waren Haushalte aus unterschiedlichen Gründen nicht erreichbar, bspw. wegen falscher Telefonnummern, Nummern von Firmen- oder Fax-Anschlüssen oder auch weil die Personen des Haushalts zwischenzeitlich verstorben oder ins Ausland verzogen waren. Darüber hinaus wies ein kleiner Teil der Stichprobe einen Sperrvermerk für telefonische Befragungen beim ADM (Verband für Interessensvertretung, Selbstregulierung und Standards in der deutschen Markt- und Sozialforschung, www.adm-ev.de) auf und durfte daher nicht auf telefonischem Wege kontaktiert werden. Andere Haushalte konnten aus sonstigen Gründen während der Befragungszeit der jeweiligen Tranchen nicht erreicht werden.

Abbildung 4.3 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wird, um für die Erreichbarkeit der Haushalte zu kontrollieren. Um die Kontaktierbarkeit von Haushalten zu beschreiben, wurden Angaben zu Uhrzeiten und Häufigkeit telefonischer Kontakte genutzt, siehe auch Abbildung 2.2. Einige Haushalte waren besonders schwer zu erreichen und wurden daher oft (11-25 Anrufe) auf Festnetz und Mobiltelefon angerufen, ebenso wie überwiegend nachmittags bis abends. Auch Haushalte, die weniger oft über das Festnetz angerufen wurden bzw. zu anderen Zeiten waren zum Teil schwierig zu erreichen. Gleiches gilt für Haushalte der Migrationsstichproben M1 und M2. Haushalte, die im Vorjahr keine Wertanlagen hatten und in den mindestens eine Person raucht weisen ebenfalls eine niedrigere Wahrscheinlichkeit auf erreicht zu werden.

Eine erhöhte Wahrscheinlichkeit Haushalte telefonisch zu erreichen, liegt bei Haushalten vor, die in denen mindestens eine Person eine Parteipräferenz für eine bestimmte Partei hat. Auch Haushalte, in denen mindestens eine verrentnete Person lebt waren leichter zu erreichen. Ebenfalls sind Haushalte die selbstgenutztes Wohneigentum bewohnen und Haushalte mit mindestens einer im öffentlichen Dienst beschäftigten Person leichter zu erreichen. Schließlich weisen auch Haushalte, die ausschließlich über einen Festnetzanschluss kontaktiert wurden, eine höhere Erreichbarkeit auf. Abbildung B.3 in Anhang B zeigt die vom zugehörigen Ausfallmodell geschätzten Wahrscheinlichkeiten für die Erreichbarkeit der Haushalte.

Abbildung 4.3: Koeffizientenplot des Modells zur Korrektur der Nichterreichbarkeit der Haushalte in der SOEP-CoV-Studie. (HH: Haushalt.)

4.4 Teilnahme der Haushalte an der SOEP-CoV-Studie

Die Haushalte, die während der jeweiligen Befragungszeiträume telefonisch erreicht werden konnten, entschieden sich dann schließlich für bzw. gegen die Teilnahme an der SOEP-CoV-Studie. Abbildung 4.4 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wurde, um für Verweigerung der Teilnahme an der SOEP-CoV-Studie zu korrigieren. Unter den Faktoren, die die Teilnahmeentscheidung der Haushalte negativ beeinflussten, sind das Nichtvorhandensein eines Internetanschlusses im Haushalt, teilweise Nichtteilnahme von Befragungspersonen am letzten SOEP Interview im Haushalt und dass der Haushaltsvorstand älter als 74 Jahre die Prädiktoren mit dem stärksten Einfluss hat. Zudem beobachten wir eine niedrigere Teilnahmewahrscheinlichkeit für Haushalte, mit mindestens einer Person nichtdeutscher Staatsangehörigkeit oder in denen mindestens eine Person der Meinung ist, dass Flüchtlinge schlecht für die Wirtschaft seien. Gleiches gilt für Haushalte in denen mindestens eine Person im Ausland geboren wurde und in denen mindestens eine Person Arbeitslosengeld II bezieht. Schließlich verringert sich die Teilnahmewahrscheinlichkeit, wenn mindestens eine Person im Haushalt keinen Schulabschluss hat.

Positiv hingegen wirkte sich hier aus, wenn der Haushalt in einer Wohngegend mit hohem Anteil an überregionalen Zeitungen wohnt oder mindestens eine Person im Haushalt ein starkes politisches Interesse hat. Auch Haushalte, in denen mindestens eine Person keine Bedenken gegenüber Ausländern hat oder in denen mindestens eine Person einen Hochschulabschluss besitzt, haben eine höhere Teilnahmewahrscheinlichkeit. Ein Wohnort in Bayern wirkt sich ebenfalls positiv auf die Teilnahmewahrscheinlichkeit aus. Besonders teilnahmebereit waren auch Haushalte mit einem weiblichen Haushaltsvorstand. In Interaktion mit der Tranchierung finden sich hingegen negative Effekte, die dadurch zu erklären sind, dass in den späteren Tranchen gezielt nach männlichen Teilnehmern für das Telefoninterview gefragt wurde. Schließlich wirkt sich auch die Zugehörigkeit zu den Teilstichproben L2 (Familientypen: Niedrigeinkommen, Alleinerziehend, Mehrkindfamilien) und L3 (Familientypen: Alleinerziehend, Mehrkindfamilien) positiv auf die Teilnahmeentscheidung aus.

Abbildung B.4 in Anhang B zeigt die vom Modell geschätzten Teilnahmewahrscheinlichkeiten auf Haushaltsebene.

Abbildung 4.4: Koeffizientenplot des Modells zur Korrektur der Teilnahmeverweigerung von kontaktierten Haushalten. (HH: Haushalt.)

4.5 Kontaktperson beim Telefoninterview

Bei SOEP-CoV wurde je Haushalt nur eine Person befragt, die auch einige Proxy-Informationen über die anderen Haushaltsmitglieder angegeben, aber zu großen Teilen über sich selbst berichtet hat. Die Auswahl der Kontaktperson war dabei nicht systematisch, sondern war davon abhängig wer zur angerufenen Zeit ans Telefon ging und bereit war, an der Befragung teilzunehmen. Generell wurde über den ganzen Tag verteilt angerufen, vermehrt allerdings am späten Nachmittag und abends, um auch berufstätige Personen befragen zu können, siehe auch Abbildung 2.2. Um eine Verzerrung hinsichtlich des Geschlechts der befragten Person zu verringern, wurde einerseits sowohl nach dem Haushaltsvorstand als auch regelmäßig nach einem männlichen Haushaltsmitglied gefragt. Da für die Teilnahme am CATI der SOEP-CoV-Studie erforderlich war, dass die zu befragende Person zum Zeitpunkt der Befragung mindestens 18 Jahre alt war, gingen auch nur SOEP-Haushaltsmitglieder in die Modellierung ein, die dieses Kriterium erfüllten. Außerdem wurden zur Modellierung nur Personen aus Haushalten berücksichtigt, in denen mindestens zwei volljährige Personen leben, da in erfolgreich kontaktierten 1-Personen- oder Alleinerziehendenhaushalten eindeutig ist, welche Person die Fragen beantwortet.

Abbildung 4.5 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wurde, um hinsichtlich Verzerrungen auf Personenebene zu korrigieren. Mit Blick auf die Selektion innerhalb der teilnehmenden Mehrpersonenhaushalte zeigt sich, dass Personen im Alter von 18 bis 24 Jahren seltener an der CATI-Befragung teilnehmen als Personen höheren Alters. Ebenso weisen Personen mit Abitur und Personen der Altersgruppen “65 bis 69” und “70 Jahre und älter” eine niedrigere Teilnahmewahrscheinlichkeit auf als Personen ohne Abitur bzw. Personen im Alter von 25 bis 68 auf. Gleiches gilt für Männer sowie für vollzeiterwerbstätige Personen.

Hingegen nehmen Personen mit Universitätsabschluss oder systemrelevanten Berufen mit einer höheren Wahrscheinlichkeit am CATI teil. Das gleiche gilt für Personen, die in einem 2-Personen Haushalt leben im Vergleich zu Personen, die in Haushalten mit mehr als 2 Personen leben. Personen mit einer mittleren Reife nehmen ebenso mit einer höheren Wahrscheinlichkeit am CATI teil, wie Personen, die bereits auf Covid-19 getestet wurden und deren Ergebnis negativ ausgefallen ist. Schließlich nimmt übermäßig häufig der Haushaltsvorstand der Befragung von 2018 an der CATI-Befragung teil.

Abbildung B.5 in Anhang B zeigt die vom Modell geschätzten Teilnahmewahrscheinlichkeiten an der CATI-Befragung auf Personenebene.

Abbildung 4.5: Koeffizientenplot des Modells zur Korrektur an der CATI-Teilnahme in der SOEP-CoV-Studie. (HH: Haushalt.)

5 Trimmen und Randanpassung

Mit dem Ziel die statistische Effizienz von gewichteten Analysen zu verbessern, wurden die Gewichte getrimmt. Durch das Trimmen der Gewichte wird die Varianz reduziert und somit einer möglichen Verzerrung gewichteter Analysen durch einzelne Beobachtungen mit großen Gewichten entgegengewirkt. Die Gewichte wurden hierbei nicht bei einem bestimmten Wert gekappt, sondern es findet eine Umverteilung der Gewichte nach der “Weight Distribution” Methode statt (vgl. Potter 1990).

Dieser Methode liegt die parametrische Annahme zugrunde, dass die Gewichte \(w\) einer inversen Beta-Verteilung mit Verteilungsfunktion \(F_w\) folgen. Die beiden Parameter der Verteilung werden aus den Gewichten geschätzt und es wird ein Maximalwert \(\tau\) berechnet, so dass \(1 – F_w (\tau) = 0,99\). Gewichte, die diesen Wert \(\tau\) überschreiten, werden an diesem Maximalwert getrimmt und die überschüssige Masse wird auf die übrigen Gewichte verteilt. Nun wird für die derart getrimmten Gewichte, analog zum obigen Vorgehen, ein neuer Maximalwert \(\hat{\tau}\) berechnet. Liegen nun Gewichte vor, die größer sind als \(\hat{\tau}\), werden diese am neuen Maximalwert getrimmt und die verbleibende Masse wird wiederum auf alle Gewichte kleiner \(\hat{\tau}\) umverteilt. Dieses Verfahren wird iterativ so lange wiederholt, bis keines der getrimmten Gewichte mehr größer ist als der neue Maximalwert oder anders ausgedrückt bis \(\tau = \hat{\tau}\). Das Trimmen der Gewichte kam zum einen auf der Haushaltsebene und zum anderen auf Ebene der Personen im CATI-Gewichtungsschritt zur Anwendung.

Um Stichprobenfehler und Undercoverage auszugleichen, werden alle Gewichte in einem letzten Schritt an bekannte Randverteilungen angepasst. Hierzu wurde die in Deville, Särndal, and Sautory (1993) beschriebene Raking Prozedur angewandt. Da für das Jahr 2020 noch keine Randverteilungen vom Statistischen Bundesamt bereitgestellt werden können (z.B. durch den entsprechenden Mikrozensus), wurden für die Randanpassungen auf Haushaltsebene und für alle Personen des Haushaltes die letzten vorhandenen Randverteilungen des Mikrozensus’ aus dem Jahr 2018 verwendet. Ein dritter zur Verfügung gestellter Gewichtungsfaktor rechnet nur die Kontaktpersonen hoch. Da es sich dabei ausschließlich um erwachsene Personen handelt und uns für diese Population keine Ränder des Mikrozensus vorlagen, wurden die entsprechenden Randverteilungen für Erwachsene auf Basis der SOEP-Daten von 2018 geschätzt.

Auf Haushaltsebene wurden Verteilungen zur Anzahl der Haushalte nach Bundesland, Haushaltsgröße, Gemeindegrößenklasse, selbstbewohntem Eigentum, Haushaltstyp sowie zum letzten Zuzugsjahr eines Haushaltsmitglieds aus dem Ausland zur Randanpassung genutzt. Der entsprechende Randanpassungsschritt erfolgte nach dem Gewichtungsschritt, der Verzerrungen auf Haushaltsebene bei einem realisierten Interview in einem Haushalt ausgleicht, und dem Trimmen der Gewichte. Die Ränder auf Haushaltsebene samt ihrer Ausprägungen und der zugehörigen Häufigkeiten sind in Tabelle A.2 in Anhang A aufgeführt.

Auf der Personenebene wurden Verteilungen zur Anzahl der Personen in der Grundgesamtheit nach Alter, Geschlecht, Staatsbürgerschaft (Deutsch vs. andere) zur Randanpassung der Gewichte herangezogen. Diese Randanpassung erfolgte an den Personengewichten, für alle Haushaltsmitglieder in einem realisierten Haushalt. Die Ränder auf Personenebene in realisierten Haushalten samt ihrer Ausprägungen und der zugehörigen Häufigkeiten sind in Tabelle A.3 in Anhang A aufgeführt. Für die Randanpassung im Anschluss an den CATI-Gewichtungsschritt werden die Ränder aus Tabelle A.4 in Anhang A zur Anpassung verwendet.

6 Zusammenfassung der Gewichte

Tabelle 6.1 weist für die einzelnen Tranchen die Anzahl der Haushalte und der Personen aus, die an der SOEP-CoV-Studie teilgenommen haben. Da je Haushalt nur eine Person interviewt wurde, ist die Zahl der am CATI teilnehmenden Personen identisch mit der Zahl der Haushalte. Darüber hinaus enthält die Tabelle Angaben dazu, wie viele Haushalte und darin lebende Personen ein Gewicht mit dem Wert 0 aufweisen. Da je Haushalt nur eine Person am CATI teilnimmt, weisen die CATI-Gewichte für die übrigen Personen im Haushalt ebenfalls den Wert 0 auf. Gewichte mit dem Wert 0 treten auf, da in der Teilstichprobe D (1994/5 Migration (1984-1994, West)) ein Schneeballverfahren zur Anwendung kam. Aufgrund dessen können für bestimmte Haushalte keine Inklusionswahrscheinlichkeiten und somit auch keine Gewichte berechnet werden. Hierbei sind Haushaltsgewichte mit hhrf gekennzeichnet, Gewichte für alle Haushaltsmitglieder mit phrf und die Gewichte von Personen, die im Rahmen der SOEP-CoV-Studie mittels CATI befragt werden konnten, mit phrf_cati.

Tabelle 6.1: Zusammenfassende Informationen zu den Gewichtungsdaten.
	Anzahl der		Anzahl der Gewichte mit Wert 0
Tranche	Haushalte	Personen	hhrf	phrf	phrf_cati
1	1.689	4.126	7	14	2.444
2	1.932	4.947	9	21	3.024
3	978	2.443	1	1	1.466
4	632	1.584	1	4	953
5	309	723	0	0	414
6	303	756	3	5	456
7	288	750	1	3	463
8	298	722	5	11	429
9	265	665	0	0	400
1-9	6.694	16.716	27	59	10.049

Die nachfolgende Tabelle 6.2 zeigt die Verteilung der verschiedenen Gewichte (phrf, phrf und phrf_cati) für die in Tabelle 6.1 berichteten Fallzahlen. Bei der Berechnung der entsprechenden Statistiken wurden Gewichte mit dem Wert 0 ausgeschlossen.

Tabelle 6.2: Verteilung der verschiedenen Gewichte nach Tranche.
Gewicht	Tranche	Minimum	Median	Mittelwert	Maximum	Standardabweichung	Summe
hhrf	1	48	3.697	6.279	62.921	7.595	10.562.046
hhrf	2	8	3.193	5.473	59.144	6.563	10.524.192
hhrf	3	35	3.931	6.371	62.995	7.741	6.224.776
hhrf	4	80	3.688	6.537	58.421	8.154	4.125.110
hhrf	5	131	3.713	6.894	56.348	8.812	2.130.310
hhrf	6	49	3.521	6.098	38.746	7.227	1.829.350
hhrf	7	18	3.630	6.745	49.683	8.130	1.935.906
hhrf	8	20	4.436	7.372	51.321	8.691	2.159.963
hhrf	9	77	3.617	7.118	65.067	9.037	1.886.347
hhrf	1-9	8	3.581	6.206	65.067	7.592	41.378.000
phrf	1	43	2.692	4.956	75.018	6.798	20.378.307
phrf	2	6	2.449	4.250	77.311	5.579	20.936.930
phrf	3	29	2.900	5.165	54.870	6.904	12.613.619
phrf	4	74	2.667	5.237	76.366	7.663	8.274.771
phrf	5	107	2.916	5.655	57.986	7.883	4.088.392
phrf	6	46	2.539	4.722	49.384	6.330	3.545.887
phrf	7	17	2.770	5.534	64.162	7.644	4.133.597
phrf	8	16	3.157	5.797	60.224	7.634	4.121.793
phrf	9	63	2.571	5.293	57.744	7.532	3.519.703
phrf	1-9	6	2.648	4.900	77.311	6.727	81.613.000
phrf_cati	1	60	5.674	10.254	92.106	12.478	17.246.453
phrf_cati	2	3	5.463	9.574	98.090	11.601	18.410.223
phrf_cati	3	49	6.263	10.790	92.106	12.925	10.542.234
phrf_cati	4	159	6.131	10.754	80.088	12.865	6.785.625
phrf_cati	5	206	6.118	11.460	98.090	13.668	3.540.989
phrf_cati	6	48	5.954	10.487	65.970	12.309	3.146.210
phrf_cati	7	26	6.186	11.244	92.106	13.966	3.227.107
phrf_cati	8	38	7.091	11.622	72.292	13.117	3.405.221
phrf_cati	9	127	6.909	12.082	72.292	13.812	3.201.754
phrf_cati	1-9	3	5.862	10.425	98.090	12.552	69.505.815

7 Ableiten eigener Gewichtungsfaktoren

Mit den SOEP-CoV-Daten ist eine Vielzahl von Analysen an unterschiedlichsten Analysemengen möglich. Für jede potentielle Analysemenge eigene Gewichte zur Verfügung zu stellen, übersteigt den Rahmen des Machbaren. Dennoch sollen und müssen die zur Verfügung gestellten Gewichte der gesamten SOEP-CoV-Stichprobe für statistische Auswertungen, die auf Populationsaussagen abzielen, genutzt werden; wenn auch nur um zu prüfen, ob die Gewichte relevant für die Berechnung von Populationsstatistiken sind (z.B. durch den simplen Vergleich von gewichteten und ungewichteten Statistiken). Die SOEP-CoV-Gewichte wurden für die gesamte Stichprobe (der neun SOEP-CoV-Tranchen) an Haushalten bzw. Personen, die an der CATI-Befragung teilgenommen haben, erzeugt. Somit stellen sie Hochrechnungsfaktoren für genau diese Stichprobe bzw. für eine Zufallsauswahl aus dieser Stichprobe dar. Das bedeutet, dass für jede Analysemenge, die diese Voraussetzung nicht erfüllt, Adjustierungsfaktoren berechnet werden müssen, damit Hochrechnungen auf die Grundgesamtheit der SOEP-CoV-Stichprobe möglich sind.

Um in einem ersten Schritt zu prüfen, ob die SOEP-CoV-Gewichte für eine Teilstichprobe der SOEP-CoV-Stichprobe verwendet werden können und — falls dies nicht ohne weiteres möglich ist — entsprechende Adjustierungsfaktoren abzuleiten, muss eine Selektivitätsanalyse durchgeführt werden:
Hierbei müssen mindestens alle Variablen, die in die geplante Analyse aufgenommen werden sollen, als erklärende Variablen in ein logistisches Regressionsmodell (oder eine probit oder cloglog Regression) einfließen.
Die abhängige Variable dieses Selektionsmodells ist ein Indikator (kodiert auf 0 und 1), der angibt ob im Vergleich zur gesamten SOEP-CoV-Stichprobe eine Datenzeile Teil der Analysemenge ist (y = 1) oder nicht (y = 0).
Das Selektionsmodell umfasst somit genauso viele Datenzeilen wie es in SOEP-CoV Beobachtungen gibt.
Zeigt nun keine der Analysevariablen einen signifikanten (d.h. p < 0,05) und gleichzeitig bedeutungsvollen Effekt (d.h. \(\beta > 0,01\)) hinsichtlich der Zuordnung zur Analysemenge, ist die betrachtete Teilstichprobe eine im Hinblick auf die Analysevariablen zufällige Auswahl aus der gesamten SOEP-CoV-Stichprobe. Die originalen SOEP-CoV-Gewichte können zur Hochrechnung dieser Teilstichprobe auf die Grundgesamtheit genutzt werden. Hierbei gilt zu beachten, dass gewichtete Angaben dann in Summe natürlich nicht die gesamte Populationsgröße ergeben, sondern eben nur auf die Teilpopulation, auf die sich die Analyse bezieht.
Ergibt die Selektivitätsanalyse allerdings Verzerrungen der Teilstichprobe hinsichtlich der Analysevariablen (d.h. gibt es signifikante und bedeutungsvolle Effekte in der Selektivitätsanalyse), ist eine Korrektur der SOEP-CoV-Gewichte erforderlich, bevor sie zu Hochrechnungszwecken herangezogen werden können. Diese Korrektur der SOEP-CoV-Gewichte erfolgt über die Multiplikation mit einem Adjustierungsfaktor, der sich wiederum aus der durchgeführten Selektivitätsanalyse ergibt.
Konkret heißt das: Alle Analysevariablen, die sich als signifikant und gleichzeitig bedeutungsvoll herausgestellt haben, fließen in eine neue Selektivitätsanalyse ein. Analysevariablen, die in der zuvor berechneten Selektivitätsanalyse nicht signifikant und/oder bedeutungsvoll waren, werden hierbei außer Acht gelassen (um eine unnötige Varianzerhöhung in den zu erzeugenden Adjustierungsfaktoren zu vermeiden). Die abhängige Variable der neuen Selektivitätsanalyse ist identisch mit der der zuvor berechneten, auch die Stichprobengröße bleibt unverändert.
Auf Basis der geschätzten (neuen) Selektivitätsanalyse müssen nun für jede Datenzeile Wahrscheinlichkeiten geschätzt (bzw. vorhergesagt) werden der Analysemenge anzugehören. Das kann in Stata mit dem Befehl predict pr getan werden und in R mit dem Befehl predict() unter Berücksichtigung des Arguments type = "response". Nun werden der Analysemenge die vorhergesagten Wahrscheinlichkeiten für eine Zugehörigkeit zur originalen SOEP-CoV-Stichprobe zugespielt. Die Inverse dieser Wahrscheinlichkeiten gibt den Adjustierungsfaktor an, der mit den SOEP-CoV-Gewichten zu multiplizieren ist, um für Verzerrungen im Vergleich zur gewichteten Ausgangsstichprobe der SOEP-CoV-Studie zu korrigieren. Mit anderen Worten, durch die Multiplikation der SOEP-CoV-Gewichte, die zur Analysemenge gehören, mit der inversen vorhergesagten Wahrscheinlichkeit ergibt sich das gesuchte adjustierte Gewicht, das zur Berechnung von Populationsstatistiken hergezogen werden kann.
Anmerkung: Es ist in jedem Fall angeraten, zu überprüfen wie gut das berechnete Selektionsmodell zwischen Zugehörigkeit und Nicht-Zugehörigkeit zur Analysemenge diskriminieren kann, z.B. durch die Nutzung entsprechender Boxplots: ein Boxplot gibt die Verteilung der (vorhergesagten) Wahrscheinlichkeiten für die Analysemenge an und ein Box-Plot zeigt die (vorhergesagten) Wahrscheinlichkeiten für den Teil der SOEP-CoV-Stichprobe, der nicht Teil der Analysemenge ist. Generell sollte der erste Boxplot eine Verteilung nahe der 1 anzeigen, der zweite eine Verteilung nahe der 0 und die Inter-Quartile-Ranges beider Boxplots sollten möglich wenig Überschneidungen in ihrem Wertebereich aufweisen. Ist dies nicht der Fall, diskriminiert das verwendete Modell nicht gut und die Hinzunahme weiterer erklärender Variablen, die den Selektionsmechanismus (besser) beschreiben, der die Analysemenge erzeugt hat, ist sinnvoll.

8 Anmerkungen

9 Literatur

Auguie, Baptiste. 2017. GridExtra: Miscellaneous Functions for „Grid“ Graphics. https://CRAN.R-project.org/package=gridExtra.

Deville, Jean-Claude, Carl-Erik Särndal, and Olivier Sautory. 1993. “Generalized Raking Procedures in Survey Sampling.” Journal of the American Statistical Association 88 (423): 1013–20. https://doi.org/10.1080/01621459.1993.10476369.

Kroh, Martin, Rainer Siegers, and Simon Kühne. 2015. “Gewichtung und Integration von Auffrischungsstichproben am Beispiel des Sozio-oekonomischen Panels (SOEP).” In Nonresponse Bias: Qualitätssicherung Sozialwissenschaftlicher Umfragen, edited by Jürgen Schupp and Christof Wolf, 409–44. Wiesbaden: Springer Fachmedien Wiesbaden. https://doi.org/10.1007/978-3-658-10459-7_13.

Kühne, Simon, Martin Kroh, Stefan Liebig, and Sabine Zinn. 2020. “The Need for Household Panel Surveys in Times of Crisis: The Case of SOEP-CoV.” Survey Research Methods 14 (2): 195–203. https://doi.org/10.18148/srm/2020.v14i2.7748.

Potter, Frank J. 1990. “A Study of Procedures to Identify and Trim Extreme Sampling Weights.” In Proceedings of the American Statistical Association, Section on Survey Research Methods, 225–30. American Statistical Association Washington, DC. http://www.asasrms.org/Proceedings/papers/1990_034.pdf.

R Core Team. 2020. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.

Robinson, David, and Alex Hayes. 2020. Broom: Convert Statistical Analysis Objects into Tidy Tibbles. https://CRAN.R-project.org/package=broom.

Siegers, Rainer, Veronika Belcheva, and Tobias Silbermann. 2020. “SOEP-Core v35 Documentation of Sample Sizes and Panel Attrition in the German Socio-Economic Panel (SOEP) (1984 until 2018).” SOEP Survey Papers 826. Berlin: DIW/SOEP. https://www.diw.de/documents/publikationen/73/diw_01.c.745900.de/diw_ssp0826.pdf.

The American Association for Public Opinion Research. 2016. Standard Definitions: Final Dispositions of Case Codes and Outcome Rates for Surveys. 9th ed. AAPOR.

Wickham, Hadley, Mara Averick, Jennifer Bryan, Winston Chang, Lucy D’Agostino McGowan, Romain François, Garrett Grolemund, et al. 2019. “Welcome to the tidyverse.” Journal of Open Source Software 4 (43): 1686. https://doi.org/10.21105/joss.01686.

Xie, Yihui, J.J. Allaire, and Garrett Grolemund. 2018. R Markdown: The Definitive Guide. Boca Raton, Florida: Chapman; Hall/CRC. https://bookdown.org/yihui/rmarkdown.

Zhu, Hao. 2019. KableExtra: Construct Complex Table with ’Kable’ and Pipe Syntax. https://CRAN.R-project.org/package=kableExtra.

Anhang

A Tabellen

Tabelle A.1: Liste der Merkmale, die im Rahmen der Gewichtung geprüft wurden.
Variable	Datensatz	Variablenlabel
lb0111	biol	Mutter berufl. Ausb., Studium abgeschl.
lb0110	biol	Vater berufl. Ausb., Studium abgeschl.
NumberOfContacts	CoV_CATIerg_Brutto	Anzahl der Kontaktversuche
anz_festnetz	CoV_CATIerg_Brutto	Anzahl Festnetznummern
anz_mobil	CoV_CATIerg_Brutto	Anzahl Mobilfunknummern
ResponseLabel	CoV_CATIerg_Brutto	Response Label
tranche	CoV_Contact_Log	CATI-Tranche
fest_mobil	CoV_Contact_Log	Festnetznummer oder Mobilfunknummer
ContactDate	CoV_Contact_Log	Kontaktdatum- und Uhrzeit
ResponseStatus	CoV_Contact_Log	Response Status
Personen	DESTATIS (GENESIS-Online Tabelle: 12411-0015)	Fortgeschriebener Bevölkerungsstand am 31.12.2018
hlc0128	hl	Ae Kreditabzahl./Monat in D
hlc0175	hl	Ae Sparbetrag/Monat
hlc0064_v2	hl	ALG II, Sozialgeld, Unterhaltskosten heute (Ja/Nein) [2010-2018]
hlc0065	hl	ALG2, Sozialgeld heute Betrag
hlc0054	hl	ALG2, Sozialgeld im letzten Jahr, Betrag pro Monat
hlf0197	hl	Anzahl Buecher im HH
hlj0005	hl	Art der Unterkunft
hlj0033	hl	AsylbLG Betrag/Monat
hlc0027_v2	hl	Ausgabenueberschuss Hoehe (Monat) [2016-2018]
hlf0180	hl	Auto im HH
hlj0038	hl	Bankkonto
hlc0105	hl	Bausparvertrag Vorjahr
hlj0043	hl	Bedarf, nicht ueber Gutscheine abgedeckt
hlj0042	hl	Bedarfsdeckung ueber Gutscheine
hlj0041	hl	Bedarfsdeckung ueber Sachleistungen
hlf0148	hl	Beintraechtigung d. Laermbelaestigung
hlf0149	hl	Beintraechtigung d. Luftverschmutzung
hlf0150	hl	Beintraechtigung d.Mangel a.Gruenflaeche
hlj0007	hl	Bestehender Haushalt oder neuer Haushalt
hlc0190	hl	Betrag Bildungspaket 2016/Monat
hlc0192	hl	Betrag Bildungspaket heute/Monat
hlc0151	hl	Betrag Einnahmen (Wertanlagen) 2015 im Ausland
hlc0150	hl	Betrag Einnahmen (Wertanlagen) 2015 in D
hlf0601	hl	Betrag Grundsteuer fuer Grundbesitz 2015
hlf0069_v5	hl	Betrag Heizkosten/Monat [2002-2014,2016-2018]
hlf0600	hl	Betrag Instandhaltung und Modernisierung 2015
hlc0045_v2	hl	Betrag Kindergeld heute/Monat (Euro) [2002-2018]
hle0016	hl	Betrag Kosten fuer Pflege/Monat von Personen nicht im HH
hlf0332	hl	Betrag Pflegekosten im Monat
hlc0179	hl	Betrag/Gegenwert erbschaft 2015
hlc0183	hl	Betrag/Gegenwert Lotteriegewinn 2015
hlc0181	hl	Betrag/Gegenwert Schenkung 2015
hlc0111_v2	hl	Betriebs-/Instandhaltungskosten Betrag Vorjahr (Euro) [2002-2018]
hlc0104	hl	Betriebsvermoegen Vorjahr
hlf0071_v1	hl	Beurteilung der Wohnungsgroesse [1984,1998-2018]
hlf0262	hl	Durchschnittliche Kosten im Monat
hlc0025_v2	hl	Einnahmeueberschuss Hoehe (Monat) [2016-2018]
hlc0107	hl	Festverzinsl. Wertpapiere Vorjahr
hlf0190	hl	Freunde zum Essen einladen 1/Monat
hlf0531	hl	Garage/Stellplatz
hlc0063	hl	Grundsicherung im Alter Betrag pro Monat
hlc0071	hl	Grundsicherung im Alter heute Betrag
hlf0178_v1	hl	Haushalt: Internet [2005,2007,2011,2013,2015-2018]
hlc0006_v3	hl	HH-Nettoeinkommensgruppen [2003-2018]
hlc0068_v2	hl	Hilfe Lebensunterhalt Betrag (Euro) [2002-2018]
hlc0055_v1	hl	Hilfe Lebensunterhalt Vorjahr [1984,1991,2010-2018]
hlc0059_v2	hl	Hilfe Lebensunterhalt Vorjahr (Betrag im Monat) (Euro) [2002-2018]
hlf0291	hl	Hilfe-,Pflegebeduerft. Person im HH
hlc0114_v3	hl	Hoehe Abzahlung Kredite (selbst und andere HH-Mitglieder) (Euro) [2011-2018]
hlf0074_v2	hl	Hoehe der monatlichen Miete (DM) [2002-2018]
hlc0197	hl	Hoehe des Betrags nach dem AsylbLG im letzten Kalenderjahr
hlf0078	hl	Hoehe durchschnittl. Stromkosten im Monat
hlf0090_v2	hl	Hoehe Heizkosten letzt.Jahr (Euro) [2002-2014,2016-2018]
hlf0084	hl	Hoehe Stromkosten letztes Jahr
hlf0178_v3	hl	Internetanschluss [2016-2017]
hlk0057	hl	Interviewdauer muendlich
hlk0058	hl	Interviewdauer schriftlich
hlf0091_v3	hl	Jaehrliche Nebenkosten (EURO) [2002-2014,2016-2018]
hlf0188	hl	Jaehrliche Urlaubsreise
hlc0093	hl	Keine Wertanlagen Vorjahr
hlc0042_v2	hl	Kindergeld letzt.J Betrag(Monat) (Euro) [2002-2018]
hlc0051_v2	hl	Kinderzuschlag Betrag Monat Vorjahr (Fragenpraezisierung) [2010-2018]
hlc0047_v2	hl	Kinderzuschlagbezug heute Betrag (mit Fragepraezisierung) [2010-2018]
hlj0004_v2	hl	Leben auslaend. Familien im Wohngebiet [2014]
hlc0106	hl	Lebensversicherung Vorjahr
hlc0079_v2	hl	Leistungen der Pflegeversicherung (Betrag pro Monat) (Euro) [2002-2018]
hlc0008_v2	hl	Miet- u.Pachteinnahmen Betrag Vorjahr (Euro) [2002-2018]
hlf0001_v3	hl	Miete oder Eigentum (auch Altersheim) [1999-2018]
hlj0029	hl	Miete/Monat
hlj0017	hl	Miete/Monat
hlk0060	hl	Monat des Interviews
hlf0081_v2	hl	Monatl Hoehe der Umlagen (DM) [2002-2014,2016-2018]
hlf0088_v2	hl	Monatl Zins-,Tilgungszahlungen (Euro) [2002-2018]
hlc0005_v2	hl	Monatliches HH-Netto-Einkommen (Euro) [2002-2018]
hlf0186	hl	Notfallruecklagen
hli0137	hl	Oekostromtarif
hlc0090_v2	hl	Pflegevers. Betrag (Euro) [2002-2018]
hlc0085_v6	hl	Pflegevers. Leistungen [2010-2018]
hlf0019_v1	hl	Qm Wohnflaeche [1984,1998-2018]
hlf0107_v2	hl	Seit wann in dieser Wohnung (Viersteller) [1999-2018]
hlc0108	hl	Sonstige Wertpapiere Vorjahr
hlc0119_v2	hl	Sparbetrag monatlich [2015-2018]
hlc0173	hl	Sparbetrag/Monat
hlc0098	hl	Sparbuch Vorjahr
hlc0010	hl	Steuerlich absetzten, Betrag Vorjahr
hlf0239_v4	hl	Telefon-Festnetzanschluesse [2016-2018]
hlc0112_v2	hl	Tilgungszahlungen und Zinsen Betrag Vorjahr (Euro) [2002-2018]
hlf0523	hl	Veraenderung der Wohnsit.
hlc0024_v2	hl	Verhaeltnis Einnahmen zu Ausgaben (Monat) [2016-2018]
hlc0095	hl	Verluste steuerlich absetzen, Betrag
hlc0083_v1	hl	Wohngeld heute (ja/nein) [1995-1998,2010-2018]
hlc0082_v2	hl	Wohngeld,Lastenzuschuss pro Monat (Euro) [2002-2018]
hlc0084_v2	hl	Wohngeldbezug heute Betrag (Euro) [2002-2018]
hlj0010	hl	Wohnung – Selbst eingerichtet oder moebliert
hlf0030	hl	Wohnung mit Balkon,Terasse
hlf0032	hl	Wohnung mit Garten,-benutzung
hlf0031	hl	Wohnung mit Keller,Abstellraeume
hlf0035	hl	Wohnung mit Sonnenkollekt., Solarenergie
hlc0013_v2	hl	Zins-u. Dividendeneinnahmen Vorjahr (Euro) [2002-2018]
hlf0059_h	hl	Zustand des Hauses in dem man wohnt [harmonisiert]
hlf0621	hl	Zwei paar Strassenschuhe
ha_tko_k_internet	Microm – Hausebene	Affinitaet fuer Internetnutzung
ha_tme_k_uebertag	Microm – Hausebene	Affinitaet Lesen ueberregionaler Tageszeitung
ha_mso_k_ausland	Microm – Hausebene	Ausland
ha_mso_k_familie	Microm – Hausebene	Familie
ha_mmo_k_fluktu	Microm – Hausebene	Fluktuation
ha_mbe_k_haustyp	Microm – Hausebene	Haustyp
ha_mso_k_status	Microm – Hausebene	Status
ha_mmo_k_volumen	Microm – Hausebene	Umzugsvolumen
p8_met_p_spaetaus	Microm – PLZ8-Ebene	Anteil der Einwohner an Spaetaussiedlern aus der frueheren Sowjetunion in %
p8_met_p_islam	Microm – PLZ8-Ebene	Anteil der Einwohner aus aussereurop. islamischen Staaten in %
p8_met_p_balkan	Microm – PLZ8-Ebene	Anteil der Einwohner aus dem Balkangebiet in %
p8_met_p_tuerkei	Microm – PLZ8-Ebene	Anteil der Einwohner aus der Tuerkei in %
p8_met_p_deutschl	Microm – PLZ8-Ebene	Anteil der Einwohner aus Deutschland in %
p8_met_p_griechen	Microm – PLZ8-Ebene	Anteil der Einwohner aus Griechenland in %
p8_met_p_italien	Microm – PLZ8-Ebene	Anteil der Einwohner aus Italien in %
p8_met_p_osteurop	Microm – PLZ8-Ebene	Anteil der Einwohner aus Osteuropa in %
p8_met_p_spanport	Microm – PLZ8-Ebene	Anteil der Einwohner aus Spanien/Portugal/Lateinamerika in %
p8_met_p_asien	Microm – PLZ8-Ebene	Anteil der Einwohner Sued-/Ost-/Suedostasiens in %
p8_met_p_afrika	Microm – PLZ8-Ebene	Anteil der Einwohner suedlich der Sahara in %
p8_met_p_uebrige	Microm – PLZ8-Ebene	Anteil der uebrigen Einwohner in %
st_kkr_w_prohh	Microm – Straßenabschnittebene	durchschnittliche Kaufkraft pro HH in dem PLZ8-Gebiet in Euro
pgpbbil01	pgen	Berufl. Bildungsabschluss
pgpbbil02	pgen	Hochschulabschluss
germborn	pgen	In Deutschland geboren
migback	pgen	Migrationshintergrund
pgpsbil	pgen	Schulabschluss
plh0136	pl	10.000EUR geschenkt, Anteil ausgeben
plh0134	pl	10.000EUR geschenkt, Anteil sparen
plh0135	pl	10.000EUR geschenkt, Anteil verschenken
plc0043_v2	pl	Monatsgehalt Brutto Vorjahr (Euro) [2002-2018]
plc0045_v2	pl	Monatsgehalt Brutto Vorjahr (Euro) [2002-2018]
plj0022	pl	Staatsangehoerigkeit vorhanden
plb0205_v2	pl	Abendarbeit, zwischen 19 und 22 Uhr (unregelmaessig) [1995-2017]
plc0041_v2	pl	Abfindung Hoehe (Euro) [2002-2018]
plb0114	pl	Abschalten von der Arbeit faellt leicht
plh0206i19	pl	Aktiv Verluste ausgleichen
plj0680_v1	pl	Aktueller Aufenthaltstitel [2016-2017]
plc0139	pl	ALG_II Sozialgeld Monate Vorjahr
plh0166	pl	Allg. Lebenszufriedenheit in einem Jahr
plh0011_v2	pl	Allgemeine Parteienpraeferenz [1984-2018]
plj0078	pl	Als Deutscher fuehlen
plc0240_v2	pl	Altersrente betriebliche Altersversorgung (EURO) [2003-2018]
plc0235	pl	Altersrente etc Monate Vorjahr
plc0249_v2	pl	Altersrente sonstige (in EURO) [2003-2018]
plc0243_v2	pl	Altersrente Unfallversicherung (in EURO) [2003-2018]
plj0671_v1	pl	Anhoerung schon stattgefunden [2016-2017]
pld0047	pl	Anzahl enge Freunde
plb0570	pl	Anzahl Mitarbeiter
plh0212	pl	Arbeite gruendlich
plb0021	pl	Arbeitslos gemeldet
plc0130_v2	pl	Arbeitslosengeld (M3-M5) [2016-2018]
plc0137_v2	pl	Arbeitslosengeld Betrag Vorjahr (Euro) [2002-2018]
plc0131_v2	pl	Arbeitslosengeld Brutto letzter Monat (Euro) [2002-2018]
plc0136	pl	Arbeitslosengeld Monate (Anz.) Vorjahr
plc0129_v2	pl	Arbeitslosenhilfe Betrag (Euro) [2002-2005,2017]
plb0211	pl	Arbeitszeitregelungen
ple0097	pl	Art der Krankenversicherung
ple0013	pl	Asthma
plj0564	pl	AsylbLG Leistungen
ple0187	pl	Ausgebranntsein (Burnout)
ple0028	pl	Ausgeglichen letzten 4 Wochen
plc0171_v2	pl	BAfoeG, Stipendium Betrag Vorjahr (Euro) [2002-2018]
plc0170	pl	BAfoeG, Stipendium Monate Vorjahr
plc0168_v2	pl	BAfoeG/Stipendium/BAB Brutto letzter Monat (Euro) [2002-2018]
plc0236_v2	pl	Beamtenversorgung Rente Brutto/Monat (Euro) [2003-2018]
plc0279_v2	pl	Beamtenversorgung Witwen-/Waisenrente Brutto/Monat (Euro) [2003-2018]
pld0095	pl	Befreundete Person 1: Alter
plj0057	pl	Befreundete Person 1: aus selben Land wie Befragungsperson
pld0092	pl	Befreundete Person 1: Geschlecht
plj0054	pl	Befreundete Person 1: Herkunft
pld0101	pl	Befreundete Person 1: hoechster Bildungsabschluss
pld0098	pl	Befreundete Person 1: ist erwerbstaetig, in Ausbildung, in Rente
pld0089_v1	pl	Befreundete Person 1: Verwandtschaft (unregelmaessig) [1988-2016]
pld0096	pl	Befreundete Person 2: Alter
plj0058	pl	Befreundete Person 2: aus selben Land wie Befragungsperson
pld0093	pl	Befreundete Person 2: Geschlecht
plj0055	pl	Befreundete Person 2: Herkunft
pld0102	pl	Befreundete Person 2: hoechster Bildungsabschluss
pld0099	pl	Befreundete Person 2: ist erwerbstaetig, in Ausbildung, in Rente
pld0090_v2	pl	Befreundete Person 2: Verwandtschaft (FID) (unregelmaessig) [1988-2016]
pld0097	pl	Befreundete Person 3: Alter
plj0059	pl	Befreundete Person 3: aus selben Land wie Befragungsperson
pld0094	pl	Befreundete Person 3: Geschlecht
plj0056	pl	Befreundete Person 3: Herkunft
pld0103	pl	Befreundete Person 3: hoechster Bildungsabschluss
pld0100	pl	Befreundete Person 3: ist erwerbstaetig, in Ausbildung, in Rente
pld0091_v1	pl	Befreundete Person 3: Verwandtschaft (unregelmaessig) [1988-2016]
plb0037_v3	pl	Befristet/unbefristet [2006-2018]
plj0566	pl	Behoerdengaenge
plb0036_v2	pl	Bei jetzigem Arbeitgeber beschaeftigt [1999-2018]
plj0175	pl	Beide Eltern in Deutschland geboren
plh0206i05	pl	Beleidigendes Verh. bei Beleidigungen
plc0311	pl	Bereits in Rente
plh0206i01	pl	Bereitschaft Gefallen zu erwidern
plh0206i06	pl	Bereitschaft Kosten aufzunehmen um Hilfe zurueckzugeben
plb0586	pl	Berufl. Stellung Selbstaendige
plb0064_v2	pl	Berufliche Stellung Angestellte [1991-2018]
plh0206i04	pl	Besondere Anstrengung Hilfe zurueckzugeben
plj0061	pl	Besuch bei Auslaendern letzte 12 Monate
plj0060	pl	Besuch bei Deutschen letzte 12 Monate
plj0322	pl	Besuch Herkunftsland i.d. letzt. 2 J.
plj0063	pl	Besuch von Auslaendern letzte 12 Monate
pli0091_v1	pl	Besuch von Kino,Pop,Jazz Konzerte,Disco (kurz) (unregelmaessig) [1985-2017]
pli0090_v2	pl	Besuch von Oper, klass. Konzerte, Theater, Ausstellungen (kurz) (unregelmaessig)
pli0097_v2	pl	Beteilig. Parteien, Kommunalpolitik, Buergerinitiativen (kurz) (unregelmaessig)
plj0132_v2	pl	Betrag an Eltern/Schwiegereltern (Euro) [2002-2018]
plj0136_v2	pl	Betrag an Kinder (Euro) [2002-2018]
plj0148_v2	pl	Betrag an nicht Verwandte (Euro) [2002-2018]
plj0565	pl	Betrag AsylbLG Leistungen im letzten Monat
plc0383_v2	pl	Betrag Erbschaft 1.Person (Euro) (letzte 15 Jahre) [2017]
plc0393_v2	pl	Betrag Erbschaft 2.Person (Euro) (letzte 15 Jahre) [2017]
plc0403_v2	pl	Betrag Erbschaft 3. Person (Euro) (letzte 15 Jahre) [2017]
plc0220_v3	pl	Betrag Rentenversicherung und Knappschaft (Euro) [2003-2018]
plc0128_v2	pl	Betrag Sozialgeld im letzten Monat (Euro) [2002-2004,2016-2018]
plb0040	pl	Betrieb d. oeffentl. Dienstes
plh0218	pl	Bin eher faul
plh0219	pl	Bin gesellig
plh0213	pl	Bin kommunikativ
plh0221	pl	Bin leicht nervoes
plh0214	pl	Bin manchmal zu grob zu anderen
plh0215	pl	Bin originell
plh0223	pl	Bin zurueckhaltend
ple0018	pl	Bluthochdruck
plj0125_v3	pl	Bruder, Brueder – Entfernung [2006,2011,2016]
plc0074	pl	Brutto Einkuenfte a. selbstaendiger Taetigkeit Mon. (Anz.) Vorjahr
plb0471_v2	pl	Brutto Lohn als Arbeitnehmer Betrag Vorjahr (Euro) [2002-2018]
plc0016	pl	Brutto Lohn als Arbeitnehmer Monate (Anzahl) Vorjahr
plh0354	pl	Bruttostundenlohn unter 10
ple0022	pl	Chronische Rueckenbeschwerden
ple0020	pl	Demenzerkrankung
plj0618	pl	Demokratie: Buergerrechte schuetzen vor staatlicher Unterdrueckung
plj0617	pl	Demokratie: Menschen waehlen Regierung in freien Wahlen
plj0615	pl	Demokratie: Regierung besteuert Reiche, unterstuetzt Armen
ple0019	pl	Depressive Erkrankung
pld0021_v2	pl	Derz. Ehepartner Entf., falls nicht i.H. [2006,2011,2016]
plg0012	pl	Derzeit in Ausbildung
plb0058	pl	Derzeitige Stellung Arbeiter
plb0065	pl	Derzeitige Stellung Beamte
plj0014_v3	pl	Deutsche Staatsangehoerigkeit [1996-2018]
ple0012	pl	Diabetes
plc0545	pl	Dritte Nebentaetigkeit Bruttoverdienst letzter Monat
plc0268_v3	pl	Dt. Rentenvers. und Knappschaft Witwen-/Waisenrente Brut./Monat (Euro) [2003-20
ple0176	pl	E-zigarette
pli0096_v2	pl	Ehrenamtliche Taetigkeit in Vereinen, Verbaenden, …(kurz) (unregelmaessig) [19
plh0206i17	pl	Eigene Reaktionen unter Kontrolle haben
ple0026	pl	Eile, Zeitdruck letzten 4 Wochen
plj0435	pl	Einfluss von Fluechtlingen auf Deutschland als Lebensort
plj0433	pl	Einfluss von Fluechtlingen auf die Wirtschaft
plb0474_v2	pl	Einkommen selbstaendig/freiberuflich Brutto/Monat Vorjahr (Euro) [2002-2018]
plb0477_v2	pl	Einkuenfte a. Nebenerwerb Betrag Vorjahr (Euro) [2002-2018]
plc0065	pl	Einkuenfte a. Nebenerwerb Monate Vorjahr
ple0009	pl	Einschraenkg.im Alltgasleben wg. gesundheitl. Probleme
ple0035	pl	Einschraenkung sozialer Kontakte wg. Gesundheit
plh0244	pl	Einstellung bezueglich Zukunft
ple0029	pl	Energie letzten 4 Wochen
plj0700	pl	Englisch: Lesen
plj0699	pl	Englisch: Schreiben
plb0158	pl	Entfernung von Wohnung zur Arbeit in km
plc0537	pl	Entnahmen aus personengesellschaften brutto letzter monat
plc0531	pl	Entnahmen aus personengesellschaften brutto/monat
plj0674	pl	Entscheidung ber Asylantrag
plj0677	pl	Ergebnis des Asylantrags
plh0222	pl	Erledige Aufgaben wirksam, effizient
plc0541	pl	Erste Nebentaetigkeit Bruttoverdienst letzter Monat
plj0668	pl	Erster Asylantrag
ple0040	pl	Erwerbs-, Schwerbehinderung
plb0022_v9	pl	Erwerbsstatus [2016-2018]
plj0140_v2	pl	Euro Betrag 2016 an (geschiedenen) Ehepartner (Euro) [2002-2018]
plj0144_v2	pl	Euro Betrag an sonstige Verwandte (Euro) [2002-2018]
plc0563	pl	Euro Betrag Kreditschulden Ausbildung/BAfoeG
plc0557	pl	Euro Gesamtwert Sachvermoegen
plc0553	pl	Euro Marktwert Kraftfahrzeug
plf0088	pl	Euro Verkehrswert gesamter Immobilien
plc0111	pl	Finanz. Absicherung Krankheit
plk0032	pl	Folgebefragungen
plj0089	pl	Gedanken an Auslandsaufenthalt
plj0588	pl	Gefuehl, aussen vor zu sein
plj0590	pl	Gefuehl, Menschen aus dem Herkunftsland zu vermissen
plj0591	pl	Gefuehl, willkommen zu sein – bei der Ankunft
plj0592	pl	Gefuehl, willkommen zu sein – heute
plh0224	pl	Gehe mit anderen freundlich um
plh0129	pl	Geld gespendet
plc0532	pl	Geldwerter vorteil durch nutzung firmenwagen
ple0021	pl	Gelenkerkrankungen (auch Arthrose, Rheuma)
pli0094_v2	pl	Geselligkeit m. Freund., Verwandt. (kurz) (unregelmaessig) [1985-2017]
ple0005	pl	Gesundheitszustand beeintr. Anstreng. Taetigkeiten
ple0004	pl	Gesundheitszustand beeintr. Treppen steigen
ple0008	pl	Gesundheitszustand gegenwaertig
plh0263_v2	pl	Gewerkschaftsmitglied (unregelmaessig) [1990-2015]
plc0051_v2	pl	Gewinnbeteiligung Vorjahr Betrag (Euro) [2002-2018]
plh0225	pl	Habe lebhafte Phantasie
plb0608	pl	Haeufige unterbrechung
plh0185	pl	Haeufigkeit aengstlich letzte 4 Wochen
plh0184	pl	Haeufigkeit aergerlich letzte 4 Wochen
plj0632	pl	Haeufigkeit des Kontakts mit Familie/Freunden im Herkunftsland
plh0186	pl	Haeufigkeit gluecklich letzte 4 Wochen
plh0187	pl	Haeufigkeit traurig letzte 4 Wochen
plc0001_v2	pl	Haushaltsmindesteinkommen netto (Euro) [2002,2007,2012,2017]
plh0206i03	pl	Heimzahlen: in eine schwierige Lage bringen
pld0134	pl	Heirat
plj0607	pl	Herkunftsland: Freie Meinungsaeusserung, Versammlungsrecht und eine unabhaengi
plj0611	pl	Herkunftsland: Gleichberechtigung von Maennern und Frauen
plj0608	pl	Herkunftsland: Pressefreiheit und Meinungsfreiheit
ple0014	pl	Herzkrankheit
plj0550	pl	Hilfe: Erlernen der deutschen Sprache
plj0556	pl	Hilfe: Finanzielle Situation, Zugang zu staatlichen Leistungen
plj0554	pl	Hilfe: Wohnungssuche
pli0051	pl	Hobbies, Freizeit Std., Werktg.
plm0554	pl	Hoehe Betrag andere finanzielle Unterstuetzungen im letzten Monat
plc0422	pl	Hoehe Restschulden aus Krediten
ple0186	pl	IGel – individuelle Gesundheitsleistungen, Vorjahr
plb0020_v2	pl	In Pflegezeit [2015-2018]
plj0654	pl	Integrationskurs des BAMF
plh0007	pl	Interesse fuer Politik
plk0038	pl	Interviewerfragen – Audiodateien: Haeufigkeit
plk0049	pl	Interviewerfragen – Einschaetzung Realitaetsnaehe des Interviews
plk0036	pl	Interviewerfragen – uebersetzte Texte: Haeufigkeit
plk0037	pl	Interviewerfragen – uebersetzte Texte: Hilfreich
plj0672	pl	Jahr Anhoerung
plj0666	pl	Jahr Asylantrag
plj0663	pl	Jahr BUEMA/Ankunftsnachweis
plh0226	pl	Kann mit Stress gut umgehen
plh0217	pl	Kann verzeihen
ple0160	pl	Kassenwechsel in Vorjahr
plb0159_v3	pl	Kein Arbeitsweg,wechselnder Arbeitsort [2000-2013,2015,2017]
p_buh9	pl	Keine Uebersetzungshilfe
pld0152	pl	Kind geboren
pli0098_v1	pl	Kirchgang, Besuch religioeser Veranstaltungen (kurz) (unregelmaessig) [1990-2017
plj0678	pl	Klage gegen Entscheidung ueber Asylantrag
ple0007	pl	Koerpergewicht in kg
ple0006	pl	Koerpergroesse in cm
ple0053	pl	Krankenhausaufenthalt Vorjahr
ple0015	pl	Krebserkrankung
plb0024_v3	pl	Laenger als 6 Wochen krank gemeldet [1999-2018]
plh0206i08	pl	Langes Nachdenken bei Unrecht
plh0182	pl	Lebenszufriedenheit gegenwaertig
plh0183	pl	Lebenszufriedenheit in 5 Jahren
plh0206i07	pl	Leichte Verarbeitung emotionaler Verletzung
ple0036	pl	Leiden unter chronischen Krankheiten
plj0073	pl	Lesekompetenz: deutsch
plc0011	pl	Letztes Wort finanzielle Entscheidung
plh0377_v2	pl	Locus of Control:Beeinflussung soz. Verh. durch Engagement [2005,2010,2015-2016
plh0381_v2	pl	Locus of Control:Erfahr.,dass andere mein Leben bestimmen [2005,2010,2015-2016]
plh0382_v2	pl	Locus of Control:Erfolg ist hart erarbeitet [2005,2010,2015-2016]
plh0385_v2	pl	Locus of Control:Faehigkeiten wichtiger als Anstrengung [2005,2010,2015-2016]
plh0378_v2	pl	Locus of Control:Habe nicht das erreicht,was ich verdiene [2005,2010,2015-2016]
plh0379_v2	pl	Locus of Control:Mein Lebenslauf haengt von mir ab [2005,2010,2015-2016]
plh0384_v2	pl	Locus of Control:Moeglichk. von soz. Umstaenden bestimmt [2005,2010,2015-2016]
plh0380_v2	pl	Locus of Control:Was man erreicht haengt von Glueck ab [2005,2010,2015-2016]
plh0386_v2	pl	Locus of Control:Wenig Kontrolle ueber Dinge in m. Leben [2005,2010,2015-2016]
plh0383_v2	pl	Locus of Control:Zweifle bei Schwierigkeiten an Faehigkt. [2005,2010,2015-2016]
plh0216	pl	Mache mir oft Sorgen
ple0017	pl	Migraene
plc0509	pl	Mindestlohn Euro/Stunde (Cent)
plc0508	pl	Mindestlohn Euro/Stunde (Euro)
plh0264_v2	pl	Mitglied im Berufsverband (unregelmaessig) [1990-2015]
plh0265	pl	Mitglied in Betriebs-,Personalrat
plh0266	pl	Mitglied in Umweltschutzorganisation
plj0118_v3	pl	Mutter – Entfernung [2006,2011,2016]
plc0153_v2	pl	Mutterschafts-/Elterngeld Brutto letzter Monat (Euro) [2002-2018]
plc0155_v2	pl	Mutterschaftsgeld Betrag Vorjahr (Euro) [2002-2018]
plc0154	pl	Mutterschaftsgeld Monate Vorjahr
plb0019_v2	pl	Mutterschutz/Elternzeit [2001-2018]
plj0009	pl	Muttersprache deutsch: beide Eltern
plh0344	pl	Nachdenken ueber geld
plb0206_v2	pl	Nachtarbeit, nach 22 Uhr (unregelmaessig) [1995-2017]
plh0341	pl	Nervositaet
plc0017_v2	pl	Netto Lohn als Arbeitnehmer Betrag Vorjahr [2002-2018]
plb0420_v2	pl	Nettoverdienst mind. /Monat (Euro) [2002-2018]
ple0027	pl	Niedergeschlagen letzten 4 Wochen
pld0067	pl	Niemand als Vertrauensperson
pld0088	pl	Niemand darf unangenehme Warheit sagen
pld0073	pl	Niemand foerdert Vorankommen im Beruf, Ausbildung
pld0082	pl	Niemand: belastender Streit, Konflikt
plf0047	pl	Niemand: Um Hilfe bitten bei Pflegebeduerftigkeit
pli0165	pl	Nutzen sozialer Online-Netzwerke
plh0333	pl	Partei Bundestagswahl
plh0204_v2	pl	Persoenliche Risikobereitschaft [2004,2006,2008-2018]
plh0206i11	pl	Positive Einstellung selbst gegenueber
plc0242	pl	Private Altersrente (in EURO)
pli0085_v2	pl	Private Internet-Nutzung [2003,2008,2013]
plc0285	pl	Private Witwenrente (in EURO)
plh0206i02	pl	Rache bei schwerem Unrecht
ple0081_v2	pl	Rauchen gegenwaertig (unregelmaessig) [2004-2018]
ple0086_v3	pl	Rauchen: Anzahl Pfeifen pro Tag (unregelmaessig) [2002-2018]
ple0086_v2	pl	Rauchen: Anzahl Zigaretten pro Tag (unregelmaessig) [2002-2018]
ple0086_v4	pl	Rauchen: Anzahl Zigarren pro Tag (unregelmaessig) [2002-2018]
plk0033	pl	Record Linkage (IEB)
plj0614	pl	Regierungsformen: Demokratisches System
plj0612	pl	Regierungsformen: Starker Fuehrer
plh0258_v9	pl	Religionszugehoerigkeit [2013,2016-2018]
plh0258_v8	pl	Religionszugehoerigkeit [2015]
plc568	pl	Rente aus dem Ausland Brutto/Monat 2017
plc0233_v2	pl	Rente/Pension Brutto letzter Monat (Euro) [2002-2018]
plc0416	pl	Restschuld Immobilie
plf0067	pl	Restschuld Wohneigentum
plc0516	pl	Riesterrente ae Brutto/Monat Vorjahr
plc0335	pl	Rueckkaufwert Vers. o. Geldanlagen
plh0220	pl	Schaetze kuenstler. Erfahrung
pld0140	pl	Scheidung
ple0011	pl	Schlafstoerung
ple0016	pl	Schlaganfall
plj0072	pl	Schreibkompetenz: deutsch
plb0571	pl	Schwarzarbeit im persoenlichen Umfeld Vorjahr
plj0124	pl	Schwester, Schwestern – Entfernung
plb0282_v2	pl	Seit Anfang Vorjahr aus Beruf ausgeschieden [2001-2018]
plg0072	pl	Seit Vorjahr Ausbildung abgeschlossen
plj0123_v3	pl	Sohn, Soehne – Entfernung [2006,2011,2016]
ple0023	pl	Sonstige Krankheit
plc0053_v2	pl	Sonstige Sonderverguetung Brutto Vorjahr (Euro) [2002-2018]
plc0203_v2	pl	Sonstige Unterstuetzung ausserhalb HH Brutto letzter Monat (Euro) [2002-2018]
plh0032	pl	Sorgen allgemeine wirtschaftliche Entwicklung
plh0042	pl	Sorgen Arbeitsplatzsicherheit
plh0335	pl	Sorgen eigene Altersversorgung
plh0035	pl	Sorgen eigene Gesundheit
plh0033	pl	Sorgen eigene wirtschaftliche Situation
plj0597	pl	Sorgen Ergebnis des Asylverfahrens
plh0038	pl	Sorgen Friedenserhaltung
plh0336	pl	Sorgen soz. Zusammenhalt der Ges.
plj0046	pl	Sorgen Zuwanderung
plj0598	pl	Sorgen, nicht in Deutschland bleiben zu koennen
plb0031_v2	pl	Stellenwechsel im Vorjahr [1994-2018]
plj0624	pl	Stellung der Frau: Ausbildung des Sohnes wichtiger als die der Tochter
plj0122_v3	pl	Tochter, Toechter – Entfernung [2006,2011,2016]
pld0163	pl	Tod der Mutter
pld0146	pl	Tod des Partners
pld0160	pl	Tod des Vaters
pld0166	pl	Tod eines Kindes
pld0143	pl	Trennung von Partner
plh0206i16	pl	Umgang mit schwierigen Situationen
plj0045	pl	Umzug nach West-/Ostdeutschland moeglich?
plc0190_v1	pl	Unterhalt aus Unterhaltsvorschusskassen Betrag Vorjahr [2010-2017]
plc0184	pl	Unterhalt aus Unterhaltsvorschusskassen Bruttobetrag pro Monat
plc0535	pl	Unterhalt von frueherem partner/kindesunterhalt brutto letzter monat
plc0528	pl	Unterhalt von frueherem partner/kindesunterhalt brutto/monat
plc0527	pl	Unterhalt von frueherem partner/kindesunterhalt monate
plc0198_v2	pl	Unterstuetzung ausserhalb des HH Betrag Vorjahr (Euro) [2002-2018]
plc0205_v1	pl	Unterstuetzung ausserhalb des HH Monate Vorjahr [1995-2018]
plj0438	pl	Unterstuetzung Fluechtlinge letztes Jahr: Spenden
plj0439	pl	Unterstuetzung Fluechtlinge zukuenftig: Spenden
plc0049_v2	pl	Urlaubsgeld Vorjahr Betrag (Euro) [2002-2018]
plj0119_v3	pl	Vater – Entfernung [2006,2011,2016]
plj0568	pl	Verbrachte Zeit mit Personen des Herkunftslandes
plj0080	pl	Verbundenheit Heimatland
plj0043	pl	Verbundenheit zum Wohnort
plh0356	pl	Verein/Sonst. Organisation
plh0206i10	pl	Vergeben und Vergessen von Unrecht
plf0063	pl	Verkehrswert Wohneigentum
plb0433_v2	pl	Verlust des Arbeitsplatzes (unregelmaessig) [1999-2018]
plc0366	pl	Vermoegenswert Betrieb, Beteiligung
plj0604	pl	Wahrscheinlichkeit einer Ausbildung oder Weiterbildung in Deutschland
plj0044	pl	Wegzug aus familiaeren/berufl.Gruenden?
plc0047_v2	pl	Weihnachtsgeld Vorjahr Betrag (Euro) [2002-2018]
p_anw_v2	pl	Weitere Personen anwesend [2016-2018]
plh0206i18	pl	Weiterentwicklung durch schwierige Situationen
ple0033	pl	Weniger geschafft wg. seelischer Probleme
ple0034	pl	Weniger Sorgfalt wg. seelischer Probleme
plc0316	pl	Wert Bausparvertrag
plc0329	pl	Wert der Geldanlagen
plh0107	pl	Wichtigkeit: Erfolg im Beruf haben
plh0111	pl	Wichtigkeit: Sich politisch, gesellschaftlich einsetzen
ple0177	pl	Wie oft Alkohol
ple0180	pl	Wie oft Fisch
ple0179	pl	Wie oft Fleisch
ple0181	pl	Wie oft Gefluegel
plc0274_v2	pl	Witwen/Waisenrente Brutto letzter Monat (Euro) [2002-2018]
plc0283_v2	pl	Witwenrente betriebliche Altersversorgung (in EURO) [2003-2018]
plc0286_v2	pl	Witwenrente Unfallversicherung (EURO) [2003-2018]
plc0281_v2	pl	Witwenrente Zusatzversorgung oeffentlicher Dienst (EURO) [2003-2018]
pld0133	pl	Wohnt Partner,-in im Haushalt
plb0241_v2	pl	Wunscharbeitszeit Std./Wo. [2000-2015,2017-2018]
plb0041	pl	Zeitarbeit
plj0024_v1	pl	Zeitpunkt Erwerb deutscher Staatsangehoerigkeit [2002-2012,2014-2018]
plh0061	pl	Ziel: Schutz freie Meinungsaeusserung
plh0180	pl	Zufriedenheit Familienleben
plh0171	pl	Zufriedenheit Gesundheit
plh0162	pl	Zufriedenheit Lebensstandard
plj0681	pl	Zufriedenheit mit Wohnsituation – Allgemein
plj0683	pl	Zufriedenheit mit Wohnsituation – Geraeuschpegel
plj0689	pl	Zufriedenheit mit Wohnsituation – Moeglichkeit, Deutsch zu lernen
plj0682	pl	Zufriedenheit mit Wohnsituation – Qualitaet des Essens
plh0177	pl	Zufriedenheit Wohnung
plh0258_v11	pl	Zugehoerigkeit islam. Religionsgemeinschaft [2013,2015-2018]
plb0417_v2	pl	Zukuenftige Erwerbstaetigkeit beabsichtigt [1994-2018]
pld0137	pl	Zusammenzug mit Partner
plc0238_v2	pl	Zusatzversorgung Rente Brutto/Monat (Euro) [2003-2018]
plc0056	pl	Zuschuesse fuer oeffentlichen Nahverkehr: Betrag (in EURO)
plj0437	pl	Zustrom von Fluechtlingen langfristig mehr Risiko oder Chance
plc0543	pl	Zweite Nebentaetigkeit Bruttoverdienst letzter Monat
AnzahlFall	RKI Daten zu COVID-19-Dashboard	COVID-19 Fälle
AnzahlGenesen	RKI Daten zu COVID-19-Dashboard	COVID-19 Genesene
AnzahlTodesfall	RKI Daten zu COVID-19-Dashboard	COVID-19 Todesfälle
IdLandkreis	RKI Daten zu COVID-19-Dashboard	Gemeindekennziffer
Inzidenz	RKI Daten zu COVID-19-Dashboard	Inzidenz
Meldedatum	RKI Daten zu COVID-19-Dashboard	Meldedatum
hid	zvp	Aktuelle Haushaltsnummer (=ZHHNR)
syear	zvp	Befragungsjahr

Tabelle A.2: Randverteilungen für die Anpassung auf HH-Ebene. Quelle: Statistisches Bundesamt, Mikrozensus 2018, eigene Berechnungen.
Merkmal	Ausprägung	Haushalte
Bundesland	Berlin, Brandenburg	3.285.000
Bundesland	Hamburg, Schleswig-Holstein	5.286.000
Bundesland	Bremen, Niedersachsen	6.453.000
Bundesland	Nordrhein-Westfalen	4.339.000
Bundesland	Hessen	2.473.000
Bundesland	Saarland, Rheinland-Pfalz	830.000
Bundesland	Baden-Württemberg	8.756.000
Bundesland	Bavaria	3.091.000
Bundesland	Mecklenburg-Vorpommern	2.454.000
Bundesland	Sachsen-Anhalt	2.156.000
Bundesland	Thüringen	1.151.000
Bundesland	Sachsen	1.104.000
HHGröße	1-Personen Haushalt	17.334.000
HHGröße	2-Personen Haushalt	13.983.000
HHGröße	3-Personen Haushalt	3.748.000
HHGröße	4-Personen Haushalt	4.923.000
HHGröße	Haushalt mit 5 oder mehr Personen	1.390.000
Gemeindegrößenklasse	Weniger als 20,000 Einwohner	7.660.000
Gemeindegrößenklasse	20,000-100,000 Einwohner	11.309.000
Gemeindegrößenklasse	100,000-500,000 Einwohner	15.642.000
Gemeindegrößenklasse	Mehr als 500,000 Einwohner	6.767.000
Eigentümer	Eigentümer	22.154.796
Eigentümer	Mieter	19.223.204
HHTyp	Single-Haushalt	17.334.000
HHTyp	2 Erwachsene ohne Kind	13.204.000
HHTyp	2 Erwachsene , 1 oder 2 Kinder	3.790.000
HHTyp	Alleinerziehendes Elternteil, weniger als 3 Kinder	1.214.000
HHTyp	Alleinerziehendes Elternteil, 3 oder mehr Kinder	4.983.000
HHTyp	Familien mit mehr als 3 Kindern	853.000
Letztes Zuzugsjahr	1900-1979	35.410.969
Letztes Zuzugsjahr	1980-1984	851.551
Letztes Zuzugsjahr	1985-1989	1.323.417
Letztes Zuzugsjahr	1990-1994	749.033
Letztes Zuzugsjahr	1995-1999	381.391
Letztes Zuzugsjahr	2000-2004	1.154.279
Letztes Zuzugsjahr	2005-2009	945.699
Letztes Zuzugsjahr	2010-2013	561.661
Nationalität	EU Bürger	35.023.584
Nationalität	Ehemaliges Jugoslawien	2.699.525
Nationalität	GUS Staaten	1.746.731
Nationalität	Türkei	632.517
Nationalität	Rest der Welt	755.007
Nationalität	Nur deutsche Nationalität	520.636
Migrationshintergrund	Keine Person mit Migrationshintergrund der 2. Generation im Haushalt	38.074.217
Migrationshintergrund	Mindestens eine Person mit Migrationshintergrund der 2. Generation im Haushalt, geboren nach 1995	572.996
Migrationshintergrund	Mindestens eine Person mit Migrationshintergrund der 2. Generation im Haushalt, geboren zwischen 1975-1994	353.175
Migrationshintergrund	Mindestens eine Person mit Migrationshintergrund der 2. Generation im Haushalt, geboren nach 1995	2.377.612

Tabelle A.3: Randverteilungen für die Anpassung auf Personenebene. Quelle: Statistisches Bundesamt, Mikrozensus 2018, eigene Berechnungen.
Merkmal	Ausprägung	Personen
Alter x Geschlecht	0-4, männlich	1.880.000
Alter x Geschlecht	0-4, weiblich	1.804.000
Alter x Geschlecht	5-9, männlich	1.825.000
Alter x Geschlecht	5-9, weiblich	1.712.000
Alter x Geschlecht	10-14, männlich	1.860.000
Alter x Geschlecht	10-14, weiblich	1.756.000
Alter x Geschlecht	15-19, männlich	2.093.000
Alter x Geschlecht	15-19, weiblich	1.940.000
Alter x Geschlecht	20-24, männlich	2.311.000
Alter x Geschlecht	20-24, weiblich	2.086.000
Alter x Geschlecht	25-29, männlich	2.650.000
Alter x Geschlecht	25-29, weiblich	2.445.000
Alter x Geschlecht	30-34, männlich	2.705.000
Alter x Geschlecht	30-34, weiblich	2.580.000
Alter x Geschlecht	35-39, männlich	2.652.000
Alter x Geschlecht	35-39, weiblich	2.538.000
Alter x Geschlecht	40-44, männlich	2.457.000
Alter x Geschlecht	40-44, weiblich	2.436.000
Alter x Geschlecht	45-49, männlich	2.851.000
Alter x Geschlecht	45-49, weiblich	2.861.000
Alter x Geschlecht	50-54, männlich	3.480.000
Alter x Geschlecht	50-54, weiblich	3.466.000
Alter x Geschlecht	55-59, männlich	3.257.000
Alter x Geschlecht	55-59, weiblich	3.257.000
Alter x Geschlecht	60-64, männlich	2.651.000
Alter x Geschlecht	60-64, weiblich	2.782.000
Alter x Geschlecht	65-69, männlich	2.341.000
Alter x Geschlecht	65-69, weiblich	2.505.000
Alter x Geschlecht	70+, männlich	5.393.000
Alter x Geschlecht	70+, weiblich	7.039.000
Ausländer	nein	71.706.000
Ausländer	ja	9.907.000
Zuzugsjahr	1900-1979	71.354.989
Zuzugsjahr	1980-1984	1.306.214
Zuzugsjahr	1985-1989	818.330
Zuzugsjahr	1990-1994	1.262.019
Zuzugsjahr	1995-1999	1.837.921
Zuzugsjahr	2000-2004	1.419.751
Zuzugsjahr	2005-2009	1.134.676
Zuzugsjahr	2010-2013	555.342
Zuzugsjahr	Andere	1.923.758
Nationalität	EU Bürger	69.872.114
Nationalität	Ehemaliges Jugoslawien	4.757.776
Nationalität	GUS Staaten	1.281.253
Nationalität	Türkei	3.166.757
Nationalität	Rest der Welt	1.633.195
Nationalität	Nur deutsche Nationalität	901.904
Migrationshintergrund	Indirekte Migration, born after 1995	4.622.919
Migrationshintergrund	Indirekte Migration, German nat., born 1975/1994	75.720.370
Migrationshintergrund	Indirekte Migration, other nat., born 1975/1994	529.641
Migrationshintergrund	Indirekte Migration, other nat. born before 1964 until 1974	524.932
Migrationshintergrund	Direkte oder keine Migration, oder indirekte Migration, aber Deutsche Nationalität und vor 1975 geboren	215.138

Tabelle A.4: Randverteilungen für die Anpassung für Erwachsene. Quelle: Statistisches Bundesamt, Mikrozensus 2018, eigene Berechnungen.
Merkmal	Ausprägung	Erwachsene
Ausländer	nein	60.902.285
Ausländer	ja	8.603.532
Alter x Geschlecht	18-19, männlich	1.048.501
Alter x Geschlecht	18-19, weiblich	1.065.027
Alter x Geschlecht	20-24, männlich	2.381.657
Alter x Geschlecht	20-24, weiblich	2.124.357
Alter x Geschlecht	25-29, männlich	2.705.653
Alter x Geschlecht	25-29, weiblich	2.461.676
Alter x Geschlecht	30-34, männlich	2.741.518
Alter x Geschlecht	30-34, weiblich	2.593.183
Alter x Geschlecht	35-39, männlich	2.669.233
Alter x Geschlecht	35-39, weiblich	2.551.020
Alter x Geschlecht	40-44, männlich	2.481.609
Alter x Geschlecht	40-44, weiblich	2.439.989
Alter x Geschlecht	45-49, männlich	2.859.804
Alter x Geschlecht	45-49, weiblich	2.866.329
Alter x Geschlecht	50-54, männlich	3.510.252
Alter x Geschlecht	50-54, weiblich	3.478.934
Alter x Geschlecht	55-59, männlich	3.264.397
Alter x Geschlecht	55-59, weiblich	3.259.593
Alter x Geschlecht	60-64, männlich	2.654.516
Alter x Geschlecht	60-64, weiblich	2.783.943
Alter x Geschlecht	65-69, männlich	2.344.381
Alter x Geschlecht	65-69, weiblich	2.516.630
Alter x Geschlecht	70+, männlich	5.491.186
Alter x Geschlecht	70+, weiblich	7.212.427

B Abbildungen

Abbildung B.1: Fallzahlenmäßige Verteilung der Geschätzten Wahrscheinlichkeiten für den Verbleib im SOEP-Core nach Tranche.

Abbildung B.2: Fallzahlenmäßige Verteilung der geschätzten Wahrscheinlichkeiten für den Einsatz in SOEP-CoV-Ausgangsbrutto, nach Tranche.

Gewichtung der SOEP-CoV-Studie

Rainer Siegers, Hans Walter Steinhauer, Sabine Zinn

Zuletzt aktualisiert am 06.08.2020