1 Übersicht

Das Sozio-Oekonomische Panel (SOEP) ist eine Längsschnittstudie am Deutschen Institut für Wirtschaftsforschung (DIW Berlin), die beginnend im Jahr 1984, eine jährliche Befragung von Haushalten und deren Haushaltsmitgliedern in Deutschland durchführt. Somit können anhand von Daten des SOEP Verläufe und Veränderungen durch externe Einflüsse sehr gut beschrieben und analysiert werden. Im Frühjahr 2020 wurden die SOEP Haushalte neben der regulären, persönlichen Befragung zusätzlich telefonisch (d.h. in einem CATI) zu ihren Erfahrungen durch die Corona-Krise befragt. Weitere Informationen zum Design und der Inhalte der SOEP-CoV-Studie bieten Kühne et al. (2020). Die Ergebnisse und Spotlights der Studie werden unter www.soep-cov.de gesammelt.

Der zuletzt veröffentlichte Scientific Use File (SUF) des SOEP in der Version 35 umfasst die Erhebungsjahre von 1984 bis einschließlich 2018. Die Daten aus dem Erhebungsjahr 2019 liegen der SOEP Abteilung im DIW Berlin ebenfalls vor, sind allerdings noch nicht aufbereitet und veröffentlicht. Aufgrund von Zuzügen zu und Auszügen aus Haushalten, ebenso wie durch Geburten neuer Personen in den Haushalt und das Sterben von Haushaltsmitgliedern verändert sich die Zusammensetzung der Haushalte über die Zeit. Zudem ist es möglich, dass Haushalte oder einzelne Haushaltsmitglieder in einem Erhebungsjahr ihre Teilnahme aussetzen. Aufgrund all dieser Veränderungen in Haushaltsstrukturen, werden für die SOEP-CoV-Studie diejenigen Haushalte ausgewählt, die in den Erhebungsjahren 2018 und 2019 mindestens an einer Erhebung teilgenommen haben und bis zum Feldbeginn 2020 nicht explizit ihre Teilnahme verweigert haben. Von den verbleibenden Haushalten werden darüber hinaus folgende Haushalte ausgeschlossen:

  • Haushalte der Geflüchteten-Stichproben M3, M4 und M5. Diese werden im Rahmen einer gesonderten Befragung unter der Verantwortung des Instituts für Arbeitsmarkt und Berufsforschung (IAB) telefonisch zu ihren Erfahrungen in der Corona-Krise befragt.
  • Haushalte der Stichproben, die 2019 erstmals befragt wurden (d.h. die Teilstichproben P und Q), um deren Teilnahmebereitschaft an der regulären 2. Welle nicht zu gefährden.
  • Haushalte der sogenannten “zentralen Bearbeitung”. Die “zentrale Bearbeitung” des SOEP Erhebungsinstituts (Kantar Public) kümmert sich um Haushalte, die über die üblichen Kontaktwege des SOEP (nämlich über Interviewer) nicht kontaktiert werden wollen oder können. Die Befragten der “Zentralen Bearbeitung” werden in der Regel telefonisch kontaktiert und füllen den Fragebogen selbständig oder telefonisch assistiert aus. Somit handelt es sich bei den zentral bearbeiteten Haushalten um Haushalte, die bereits im Rahmen der regulären SOEP Befragung eine große Neigung der Nichtteilnahme zeigen. Diese Haushalte sollen durch Sonderbefragungen nicht zusätzlich belastet werden.
  • Haushalte ohne gültige Telefonnummer, da diese im Rahmen der SOEP-CoV-Studie nicht telefonisch befragt werden können.

Die Stichprobe der verbleibenden Haushalte wurde hinsichtlich ihrer Zusammensetzung und der Kontaktinformationen durch das Erhebungsinstitut des SOEP auf den Zeitpunkt März 2020 aktualisiert und als Bruttostichprobe für die CoV-Studie an das SOEP zurückgespielt. Diese wurde zufällig auf insgesamt neun Tranchen verteilt. Diese werden zeitlich aufeinander folgend befragt. Dabei sind die Tranchen so konstruiert, dass ihre Stichprobengröße über die Zeit abnimmt. Dieser Ansatz hat der Tatsache Rechnung getragen, dass die Menschen in Deutschland in den ersten Wochen des kompletten Lockdowns (und somit während der Feldzeit der ersten vier Tranchen) den größten Herausforderungen und somit Änderungen im alltäglichen Leben gegenüberstanden.

Die ersten vier Tranchen sind die größten mit einem Befragungszeitraum von jeweils zwei Wochen. Die restlichen fünf Tranchen fallen kleiner aus und ihr Befragungszeitraum erstreckt sich auf eine Woche. Einzelne Interviews konnten erst mit einigen Tagen Verzögerung realisiert werden, so dass die tatsächlichen Befragungszeiträume zwischen den Tranchen nicht disjunkt sind. Die Befragungszeiträume und Stichprobenumfänge sind in Tabelle 1.1 nach den einzelnen Tranchen ausgewiesen.

Tabelle 1.1: Befragungszeiträume und Stichprobenumfänge nach Tranchen.
Befragungszeitraum
Status der Haushalte in der Stichprobe
Tranche Feldstart Feldende Eingesetzt Erreicht Realisiert
1 01.04.2020 18.04.2020 2.756 2.068 1.689
2 14.04.2020 02.05.2020 3.296 2.450 1.932
3 27.04.2020 16.05.2020 1.767 1.310 978
4 11.05.2020 30.05.2020 1.183 871 632
5 25.05.2020 06.06.2020 608 443 309
6 02.06.2020 13.06.2020 629 450 303
7 08.06.2020 20.06.2020 578 409 288
8 15.06.2020 27.06.2020 598 433 298
9 22.06.2020 04.07.2020 584 405 265
1-9 01.04.2020 04.07.2020 11.999 8.839 6.694

Der Feldstart der SOEP-CoV-Studie war am 1. April 2020 und der letzte Tag der Befragung von Tranche 9 war am 4. Juli 2020. In den Tranchen 1 bis 9 wurden 11.999 Haushalte eingesetzt, wovon 8.839 Haushalte telefonisch erreicht werden konnten und schließlich 6.694 an der SOEP-CoV-Studie teilgenommen haben.

Eine grafische Aufbereitung der Stichprobenumfänge nach Status (Kontaktierbarkeit sowie Teilnahmebereitschaft) und Tranchen findet sich in Abbildung 1.1. Der linke Teil der Abbildung zeigt dabei Verteilung nach Tranche Kontakt- bzw. Teilnahmestatus in absoluten Fallzahlen, der rechte Teil in Anteilen.

Der rechten Abbildung ist zu entnehmen, dass der Anteil der teilnehmenden Haushalte im Zeitverlauf leicht, aber stetig, gesunken ist. (Hier liegt die Vermutung nahe, dass das anfänglich große Interesse in der Bevölkerung am Thema “Corona” über Zeit abgenommen hat.) Der Anteil an Haushalten, die nicht erreicht werden konnten, ist über die Tranchen hinweg indes nahezu unverändert.

Einsatzstichproben nach Tranche und Status.

Abbildung 1.1: Einsatzstichproben nach Tranche und Status.

2 Ablauf der SOEP-CoV-Gewichtung

Die Gewichtung der SOEP-CoV-Studie verlief in weiten Teilen analog zur Gewichtung des SOEP-Core. Diese wird detailliert von Kroh, Siegers, and Kühne (2015) beschrieben und ist für die aktuelle Version 35 dokumentiert in Siegers, Belcheva, and Silbermann (2020).

Als Ausgangsgewicht für die Gewichtung der Haushalte in der SOEP-CoV-Studie diente das Haushaltsgewicht (hhrf) ihrer letzten realisierten Befragung bis 2018, also in der Regel der SOEP-Welle bi (aus der SOEP SUF Version v35). Dieses wurde für die Haushalte der SOEP-CoV-Studie für aufeinanderfolgende Ausfallschritte auf Haushaltsebene adjustiert und bezüglich verschiedener Populationsverteilungen, die dem Mikrozensus 2018 entnommen wurden, randangepasst.

Ausgehend von diesen Haushaltsgewichten wurden über einen weiteren Randanpassungsschritt Gewichte für alle Personen in den teilnehmenden Haushalten generiert. Für diejenige Person des Haushalts, die an der CATI-Befragung teilgenommen hat, wurde ein weiterer Gewichtungsschritt durchgeführt, der auftretende Selektionseffekte korrigiert.

Die nachfolgende Abbildung 2.1 zeigt schematisch den Ablauf der Gewichtung. Konkret wurden in einem ersten Schritt die Ausgangsgewichte für die Veränderungen zwischen der Zusammensetzung des SOEP im Jahr 2018 und 2020 korrigiert. In diesem Zusammenhang wurden die 2018er SOEP Haushaltsgewichte angepasst um Zugänge zu (Zuzug in bestehende Haushalte, Neugeborene) und Abgänge (Verstorbene, Verweigerer) aus der Stichprobe.

Im darauffolgenden Schritt wurde für die Haushalte korrigiert, die von vornherein von der Teilnahme an der SOEP-CoV-Studie ausgeschlossen waren (siehe Abschnitt 1).

Schematischer Ablauf der Gewichtung für die SOEP-CoV-Studie (HH: Haushalte.).

Abbildung 2.1: Schematischer Ablauf der Gewichtung für die SOEP-CoV-Studie (HH: Haushalte.).

Für eine zeitnahe Verwendung der Daten wurde die Stichprobe der SOEP-CoV-Studie nach Abschluss bestimmter Tranchen jeweils gemeinsam gewichtet. Hierbei wurde der tranchenweise Einsatz berücksichtigt und die Haushalte jeweils auf die Grundgesamtheit hochgerechnet. Insbesondere der Einsatz der Teilstichproben M1 und M2 (Migrationsstichproben), der erst ab der zweiten Tranche stattfand, fand in diesem Schritt Berücksichtigung.

Um eine möglichst heterogene Zahl von verschiedenen Haushaltsmitgliedern zu erreichen, wurden alle Haushalte zu verschiedenen Tageszeiten von 7 Uhr morgens bis 21 Uhr abends angerufen. Generell wurde auch davon ausgegangen, dass aufgrund der Ausgangsbeschränkungen und des erhöhten Anteils an Personen, die durch die Krise im Home Office arbeiteten, Befragungspersonen telefonisch besser zu erreichen sind als vor der Krise. Die entsprechende Verteilung der Anrufe nach Wochentag, Uhrzeit und Anschluss ist in Abbildung 2.2 dargestellt. Dennoch verbleiben zwischen 25 und 31 Prozent der Haushalte, die im jeweiligen Befragungszeitraum nicht erreicht werden konnten (vgl. hierzu Abbildung 1.1 weiter oben). Im dritten Schritt der Gewichtung wurde daher für die Kontaktierbarkeit der Haushalte innerhalb der jeweiligen Befragungszeiträume korrigiert.

Anzahl der Anrufe nach Uhrzeit, Wochentag und Anschluss.

Abbildung 2.2: Anzahl der Anrufe nach Uhrzeit, Wochentag und Anschluss.

Im vierten Schritt wurde schließlich für die Bereitschaft der Haushalte korrigiert, an der SOEP-CoV-Befragung teilzunehmen. Für die SOEP-CoV-Studie konnten innerhalb der einzelnen Tranchen zwischen 69 und 75 Prozent der eingesetzten Haushalte erreicht werden. Über die Tranchen 1 bis 9 hinweg wurden 73 Prozent erreicht. Von den erreichten Haushalten konnten innerhalb der einzelnen Tranchen zwischen 65 und 82 Prozent der Haushalte realisiert werden. Über die Tranchen 1 bis 9 hinweg wurden 72 Prozent realisiert. Somit ergibt sich eine Response Rate nach AAPOR (The American Association for Public Opinion Research 2016) von RR1 = 0,558. Innerhalb der einzelnen Tranchen schwankt sie zwischen 0,454 und 0,613. Diesem Schritt folgt eine Randanpassung auf eine Vielzahl an Populationsverteilungen, siehe Abschnitt 5, der die Gewichtung auf Haushaltsebene abschließt.

Anschließend wurden auf Basis der Haushaltsgewichte über einen weiteren Randanpassungsschritt Hochrechnungsfaktoren für die einzelnen Haushaltsmitglieder erstellt. Das Verfahren und die hierfür verwendeten Randverteilungen sind im Abschnitt 5 genauer beschrieben.

Auf Basis dieses Personengewichts erzeugen wir in einem letzten Schritt Hochrechnungsfaktoren für die auskunftgebende Person eines teilnehmenden Haushalts. In diesem Schritt wird für die selektive (Selbst-)Auswahl der Auskunftsperson bei Haushalten mit mindestens zwei Erwachsenen korrigiert.

3 Merkmale für die Gewichtung

In die Ausfallmodelle (cloglog Regressionen) der SOEP-CoV-Gewichtung gingen über 400 Merkmale auf Haushalts- und Personenebene ein. Der Großteil der Merkmale entstammt den vorangegangenen Wellen der Paneldaten des SOEP. Insgesamt flossen Variablen aus zahlreichen Befragungsgebieten des SOEP ein wie beispielsweise Demographie, Arbeit, Gesundheit, Bildung, Familie, Finanzen, Persönlichkeit, Migration oder auch politische Einstellung. Zudem wurden in den Ausfallmodellen, soweit sinnvoll und möglich, Personenmerkmale aggregiert auf Haushaltsebene berücksichtigt. Eine Liste mit Merkmalen, die für die Gewichtung des SOEP-Core Version 35 verwendet wurden findet sich in Siegers, Belcheva, and Silbermann (2020 S. 63f, 70ff).

Auch Informationen über den Kontaktverlauf gingen in die Gewichtung ein. Von Seiten des Erhebungsinstitutes wurden dem SOEP für insgesamt 86.069 Anrufe die Kontaktprotokolle der Telefonverläufe zur Verfügung gestellt. Diese umfassen Informationen zu erfolgreichen und erfolglosen Kontaktversuchen. Zusätzlich enthalten sie Informationen zu Datum und Uhrzeit eines Kontaktversuchs, ob über eine Festnetz- oder Mobiltelefonnummer angerufen wurde und den Rücklaufcode zu dem jeweiligen Kontaktversuch. Aus diesen Informationen haben wir weitere Variablen gebildet, die bspw. angeben, über welchen Telefonanschluss (Festnetz, Mobiltelefon, beide) ein Haushalt kontaktiert wurde oder wie oft ein Haushalt zu bestimmten Tageszeiten kontaktiert wurde.

Des weiteren wurden die jeweils tagesaktuellen Corona-Fallzahlen (Anzahl der Erkrankten, Verstorbenen, Genesenen) auf Kreisebene zum Tag des Kontaktversuchs bzw. Interviews verwendet. Die entsprechenden Daten werden vom Robert Koch-Institut öffentlich zugänglich gemacht.1 Mit Hilfe der vom Statistischen Bundesamt bereitgestellten Bevölkerungszahlen auf Kreisebene wurde zusätzlich zu den obigen Größen die Corona-Inzidenz auf Kreisebene berechnet.2 Auch diese Inzidenz war Teil der Gewichtungsvariablen.

Ebenso flossen kleinräumige Informationen unterhalb der Kreisebene, überwiegend zur Sozialstruktur von Nachbarschaften, in die Ausfallmodellierung ein. Entsprechende Daten werden von Microm bereitgestellt.

Tabelle A.1 in Anhang A fasst alle Variablen zusammen, die in den verschiedenen Ausfallmodellen auf ihren Einfluss hinsichtlich einer Einschluss in die Stichprobe, Erreichbarkeit oder Teilnahme hin geprüft wurden.

Nicht alle Variablen fließen in jedes Ausfallmodell ein. Der Grund hierfür ist offensichtlich: unter den über 400 verfügbaren Merkmalen haben erwartungsgemäß viele keinen Einfluss auf die zu erklärende Variable (d.h. die Einschluss in die Stichprobe, die Kontaktierbarkeit oder die Teilnahme) und/oder sind miteinander hoch korreliert. Nimmt man unnötig viele erklärende Variablen in ein Modell auf, erzeugt dies eine große Streuung in den zu erzeugenden Gewichtungsfaktoren (die sich aus dem Inversen der vorhergesagten Einschluss-, Kontakt- und Teilnahmewahrscheinlichkeiten ergeben). Dies sollte aus Gründen der Stichprobeneffizienz in jedem Fall vermieden werden.

Daher wurden vor jeglicher multivariaten (Ausfall-)Modellierung alle Variablen einzeln auf ihren Zusammenhang mit der zu erklärenden Variable (d.h. Einschluss in die Stichprobe, Kontaktierbarkeit und Teilnahme) geprüft. Nur wenn dieser Zusammenhang signifikant (p<0.05) war, wurde die entsprechende Variable in die vorläufige Menge der erklärenden Variablen für das entsprechende Ausfallmodell aufgenommen. Aus Gründen der Modelleffizienz wurden aus der Menge der erklärenden Variablen zudem noch stark korrelierte Merkmale ausgeschlossen. Hierfür wurde die Korrelation aller erklärenden Variablen untereinander bestimmt. Von Merkmalen, die eine betragsmäßige Korrelation von größer als 0,95 aufwiesen, floss nur jenes in das Ausfallmodell ein, das den größten (signifikanten) Einfluss auf die zu erklärende Variable (d.h. die Einschluss in die Stichprobe, die Kontaktierbarkeit oder die Teilnahme) hatte. So ergaben sich für die verschiedenen Ausfallmodelle unterschiedliche Mengen an erklärenden Variablen.

In einem letzten Schritt fand nun noch eine Variablenselektion anhand des bayesianischen Informationskriteriums (BIC) statt. Hierbei wurden dem jeweiligen Modell iterativ Variablen entnommen bzw. wieder hinzugefügt, wenn diese Veränderung im Modell zu einem niedrigeren BIC und somit zu einer besseren Modellgüte führte. Dieses hier beschriebene dreistufige Verfahren zur Variablenselektion fand für jedes der Ausfallmodelle Anwendung, die im Rahmen der SOEP-CoV-Gewichtung geschätzt wurden.

4 Geschätzte Gewichtungsmodelle

Dieser Abschnitt präsentiert die Modelle, die für die oben aufgeführten Gewichtungsschritte geschätzt wurden.3 Die Ergebnisse werden in Form von Koeffizientenplots präsentiert. Auf der y-Achse sind die Merkmale abgetragen, die als erklärende Variablen in das jeweilige Gewichtungsmodell eingeflossen sind. Parallel zur x-Achse sind die Werte der geschätzten Koeffizienten (roter Punkt) samt ihres 95%-Konfidenzintervalls (rote Balken mit vertikalen Enden) dargestellt. Die gestrichelte, vertikale Linie markiert den Wert 0. Die geschätzten Koeffizienten sind dabei vom kleinsten (oben links) hin zum größten (unten rechts) sortiert. Merkmale, deren Koeffizientenschätzer links der grau gestrichelten Linie liegen, weisen auf einen negativen Einfluss hin. Merkmale, deren Koeffizientenschätzer rechts der grau gestrichelten Linie liegen weisen auf einen positiven Einfluss hin.4

4.1 Ausfälle zwischen 2018 und der Bruttostichprobe SOEP-CoV

Abbildung 4.1 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wurde, um für die Ausfälle zwischen der 2018er SOEP-Welle bi und der Bruttostichprobe an Haushalten im Jahr 2020 zu korrigieren. Wir finden, dass die Nichtteilnahme im Erhebungsjahr 2018 einen deutlich negativen Effekt auf die Bleibewahrscheinlichkeit im SOEP 2020 hat. Weiter beeinflussen der Einsatz von Übersetzungshilfen in den Migrationsstichproben im Rahmen der letzten Erhebung sowie die Zugehörigkeit zur den Migrationsstichproben M1 und M2 die Teilnahmebereitschaft negativ. Haushalte mit sehr jungen Haushaltsmitgliedern weisen ebenso wie Haushalte mit alten Haushaltsvorständen eine deutlich geringere Bleibewahrscheinlichkeit auf.5 Auch das Nichtvorhandensein eines Internetanschlusses im Haushalt wirkt sich negativ aus auf die Wahrscheinlichkeit im SOEP zu verbleiben. Lebt mindestens eine Person im Haushalt, die angibt besonders heimatverbunden zu sein, findet sich ein negativer Effekt auf die Bleibewahrscheinlichkeit. Das Gleiche gilt für Merkmale, die in Bezug zu fehlenden Werten (konkret: partial unit nonrespone und ein hoher Anteil an item nonresponse auf Haushaltsebene) stehen. Schließlich wirkt sich auch der Umstand, dass das letzte Interview spät in der Feldphase durchgeführt wurde, negativ auf den Verbleib im SOEP aus.

Positiv auf die Bleibewahrscheinlichkeit wirken sich hingegen das Vorhandensein einer Parteipräferenz sowie ein starkes politisches Interesse bei mindestens einem Haushaltsmitglied aus. Ebenfalls positiv wirkt es sich aus, wenn eine der Personen im Haushalt ledig oder mindestens eine Person im Haushalt einen systemrelevanten Job hat. Haushalte, in denen zwei Erwachsene ohne Kinder leben und Haushalte in denen in der letzten Erhebung das Zusatzinstrument für die Mutter-Kind-Befragung ausgefüllt wurde haben eine höhere Wahrscheinlichkeit im SOEP zu verbleiben als Haushalte mit mehr als 2 Personen in denen keine Kinder leben und Haushalte, in denen dieses Instrument nicht ausgefüllt wurde. Angehörige der Teilstichproben L3, die zum Zeitpunkt der Ziehung nur die Familientypen Alleinerziehende und Mehrkindfamilien enthielten, haben ebenfalls eine höhere Bleibewahrscheinlichkeit.

Abbildung B.1 in Anhang B zeigt die vom Modell geschätzten Bleibewahrscheinlichkeiten.

Koeffizientenplot des Modells zur Korrektur von Ausfällen zwischen der Befragung 2018 und der SOEP-CoV-Studie. (HH: Haushalt.)

Abbildung 4.1: Koeffizientenplot des Modells zur Korrektur von Ausfällen zwischen der Befragung 2018 und der SOEP-CoV-Studie. (HH: Haushalt.)

4.2 Tranchenweise eingesetzte Fälle

Für die Befragung im Rahmen der SOEP-CoV-Studie kamen nur Haushalte in Frage, für die eine aktuelle Telefonnummer vorlag und die zuletzt nicht durch die “zentrale Bearbeitung” des Erhebungsinstituts betreut wurden, siehe Abschnitt 1. Die (potentielle) selektive Verzerrung des Ausgangsbrutto für SOEP-CoV im Vergleich zur SOEP Stichprobe 2018 wird im folgenden Modell (anhand von Informationen aus der SOEP Befragung 2018) untersucht und quantifiziert.

Abbildung 4.2 zeigt die geschätzten Koeffizienten und deren 95%-Konfidenzintervalle für das zugehörige Ausfallmodell mit cloglog-Link. Auch in diesem Fall sind die Merkmale, deren Koeffizientenschätzer links der grau gestrichelten Linie liegen, relativ weniger im Ausgangsbrutto von SOEP-CoV vorhanden als im Gesamt-SOEP. Die Nichtteilnahme an der SOEP-Erhebung im Jahr 2018 ebenso wie Haushalte mit jungen (jünger als 35 Jahre) Haushaltsvorständen, sind relativ weniger im Ausgangsbrutto enthalten. Gleiches gilt für Haushalte, aus denen mindestens eine Person seit 2018 ausgezogen ist und Haushalte in Ostdeutschland (Haushalte in Thüringen und Sachsen-Anhalt und Haushalte der Teilstichprobe C, welche das Ausgangs-Sample für Haushalte Ostdeutschland aus dem Jahr 1990 bildet). Ein hohes Niveau an Item Nonresponse auf Haushalts-, wie auch auf Personenebene, führt zu einer geringeren Wahrscheinlichkeit. Auch die Zugehörigkeit zu den Teilstichproben A (Ausgangs-Sample Westdeutschland; 1984) und O (Haushalte in Gebieten der Sozialen Stadt; 2018) führt zu einer niedrigeren Wahrscheinlichkeit im Ausgangsbrutto zu verbleiben. Schließlich sind auch Haushalte mit zwei Erwachsenen ohne Kinder und ‘andere’ Haushaltszusammensetzungen relativ weniger wahrscheinlich. Schließlich wirkt sich auch die Unzufriedenheit mit dem Familienleben negativ auf den Verbleib im Ausgangsbrutto aus.

Relativ häufiger hingegen wurden Haushalte eingesetzt, in denen mindestens eine Person mehr als 3 Stunden Freizeit werktags hat, deren ältestes Haushaltsmitglied älter als 65 Jahre ist, in denen mindestens eine Person selbstständig ist, deren Haushaltsvorstand älter als 74 Jahre ist und deren Haushaltsvorstand zum Zeitpunkt der Stichprobenziehung noch nicht im Haushalt lebte. Ebenfalls überproportional im Ausgangsbrutto der Stichprobe enthalten sind Haushalte, bei denen das Interview der letzten Befragung besonders lang (4. Quartil der Verteilung der Befragungsdauer) oder kurz (1. Quartil der Verteilung der Befragungsdauer) gedauert hat. Ebenfalls häufiger im Ausgangsbrutto verblieben sind Haushalte der Teilstichproben J (Aufstockung aus dem Jahr 2011), K (Aufstockung aus dem Jahr 2012), Teilstichproben aus den Jahren 2010 und 2011 mit Fokus auf unterschiedliche Familientypen L1 (Geburtskohorten von 2007 bis 2010), L2 (Niedrigeinkommen, Alleinerziehend, Mehrkindfamilien) und L3 (Alleinerziehend, Mehrkindfamilien). Gleiches gilt für die Migrationsstichproben M1 aus 2013 und M2 aus dem Jahr 2015, sowie für die Teilstichprobe N (Aufstockung aus dem Jahr 2017).

Abbildung B.2 in Anhang B zeigt die vom Modell geschätzten Wahrscheinlichkeiten für den Einsatz in der SOEP-CoV-Studie.

Koeffizientenplot des Modells zur Korrektur des designbedingten Verzichts auf Haushalte der

Abbildung 4.2: Koeffizientenplot des Modells zur Korrektur des designbedingten Verzichts auf Haushalte der “zentralen Bearbeitung” oder ohne bekannte Telefonnummer. (HH: Haushalt.)

4.3 Telefonische Erreichbarkeit der Haushalte

Im Gegensatz zur bisherigen Befragung des SOEP, die für gewöhnlich mittels eines persönlichen computergestützten (CAPI) oder schriftlichen (PAPI) Interviews durchgeführt wird, wurde diese Studie als telefonische Umfrage (CATI) durchgeführt. Hierbei waren Haushalte aus unterschiedlichen Gründen nicht erreichbar, bspw. wegen falscher Telefonnummern, Nummern von Firmen- oder Fax-Anschlüssen oder auch weil die Personen des Haushalts zwischenzeitlich verstorben oder ins Ausland verzogen waren. Darüber hinaus wies ein kleiner Teil der Stichprobe einen Sperrvermerk für telefonische Befragungen beim ADM (Verband für Interessensvertretung, Selbstregulierung und Standards in der deutschen Markt- und Sozialforschung, www.adm-ev.de) auf und durfte daher nicht auf telefonischem Wege kontaktiert werden. Andere Haushalte konnten aus sonstigen Gründen während der Befragungszeit der jeweiligen Tranchen nicht erreicht werden.

Abbildung 4.3 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wird, um für die Erreichbarkeit der Haushalte zu kontrollieren. Um die Kontaktierbarkeit von Haushalten zu beschreiben, wurden Angaben zu Uhrzeiten und Häufigkeit telefonischer Kontakte genutzt, siehe auch Abbildung 2.2. Einige Haushalte waren besonders schwer zu erreichen und wurden daher oft (11-25 Anrufe) auf Festnetz und Mobiltelefon angerufen, ebenso wie überwiegend nachmittags bis abends. Auch Haushalte, die weniger oft über das Festnetz angerufen wurden bzw. zu anderen Zeiten waren zum Teil schwierig zu erreichen. Gleiches gilt für Haushalte der Migrationsstichproben M1 und M2. Haushalte, die im Vorjahr keine Wertanlagen hatten und in den mindestens eine Person raucht weisen ebenfalls eine niedrigere Wahrscheinlichkeit auf erreicht zu werden.

Eine erhöhte Wahrscheinlichkeit Haushalte telefonisch zu erreichen, liegt bei Haushalten vor, die in denen mindestens eine Person eine Parteipräferenz für eine bestimmte Partei hat. Auch Haushalte, in denen mindestens eine verrentnete Person lebt waren leichter zu erreichen. Ebenfalls sind Haushalte die selbstgenutztes Wohneigentum bewohnen und Haushalte mit mindestens einer im öffentlichen Dienst beschäftigten Person leichter zu erreichen. Schließlich weisen auch Haushalte, die ausschließlich über einen Festnetzanschluss kontaktiert wurden, eine höhere Erreichbarkeit auf. Abbildung B.3 in Anhang B zeigt die vom zugehörigen Ausfallmodell geschätzten Wahrscheinlichkeiten für die Erreichbarkeit der Haushalte.

Koeffizientenplot des Modells zur Korrektur der Nichterreichbarkeit der Haushalte in der SOEP-CoV-Studie. (HH: Haushalt.)

Abbildung 4.3: Koeffizientenplot des Modells zur Korrektur der Nichterreichbarkeit der Haushalte in der SOEP-CoV-Studie. (HH: Haushalt.)

4.4 Teilnahme der Haushalte an der SOEP-CoV-Studie

Die Haushalte, die während der jeweiligen Befragungszeiträume telefonisch erreicht werden konnten, entschieden sich dann schließlich für bzw. gegen die Teilnahme an der SOEP-CoV-Studie. Abbildung 4.4 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wurde, um für Verweigerung der Teilnahme an der SOEP-CoV-Studie zu korrigieren. Unter den Faktoren, die die Teilnahmeentscheidung der Haushalte negativ beeinflussten, sind das Nichtvorhandensein eines Internetanschlusses im Haushalt, teilweise Nichtteilnahme von Befragungspersonen am letzten SOEP Interview im Haushalt und dass der Haushaltsvorstand älter als 74 Jahre die Prädiktoren mit dem stärksten Einfluss hat. Zudem beobachten wir eine niedrigere Teilnahmewahrscheinlichkeit für Haushalte, mit mindestens einer Person nichtdeutscher Staatsangehörigkeit oder in denen mindestens eine Person der Meinung ist, dass Flüchtlinge schlecht für die Wirtschaft seien. Gleiches gilt für Haushalte in denen mindestens eine Person im Ausland geboren wurde und in denen mindestens eine Person Arbeitslosengeld II bezieht. Schließlich verringert sich die Teilnahmewahrscheinlichkeit, wenn mindestens eine Person im Haushalt keinen Schulabschluss hat.

Positiv hingegen wirkte sich hier aus, wenn der Haushalt in einer Wohngegend mit hohem Anteil an überregionalen Zeitungen wohnt oder mindestens eine Person im Haushalt ein starkes politisches Interesse hat. Auch Haushalte, in denen mindestens eine Person keine Bedenken gegenüber Ausländern hat oder in denen mindestens eine Person einen Hochschulabschluss besitzt, haben eine höhere Teilnahmewahrscheinlichkeit. Ein Wohnort in Bayern wirkt sich ebenfalls positiv auf die Teilnahmewahrscheinlichkeit aus. Besonders teilnahmebereit waren auch Haushalte mit einem weiblichen Haushaltsvorstand. In Interaktion mit der Tranchierung finden sich hingegen negative Effekte, die dadurch zu erklären sind, dass in den späteren Tranchen gezielt nach männlichen Teilnehmern für das Telefoninterview gefragt wurde. Schließlich wirkt sich auch die Zugehörigkeit zu den Teilstichproben L2 (Familientypen: Niedrigeinkommen, Alleinerziehend, Mehrkindfamilien) und L3 (Familientypen: Alleinerziehend, Mehrkindfamilien) positiv auf die Teilnahmeentscheidung aus.

Abbildung B.4 in Anhang B zeigt die vom Modell geschätzten Teilnahmewahrscheinlichkeiten auf Haushaltsebene.

Koeffizientenplot des Modells zur Korrektur der Teilnahmeverweigerung von kontaktierten Haushalten. (HH: Haushalt.)

Abbildung 4.4: Koeffizientenplot des Modells zur Korrektur der Teilnahmeverweigerung von kontaktierten Haushalten. (HH: Haushalt.)

4.5 Kontaktperson beim Telefoninterview

Bei SOEP-CoV wurde je Haushalt nur eine Person befragt, die auch einige Proxy-Informationen über die anderen Haushaltsmitglieder angegeben, aber zu großen Teilen über sich selbst berichtet hat. Die Auswahl der Kontaktperson war dabei nicht systematisch, sondern war davon abhängig wer zur angerufenen Zeit ans Telefon ging und bereit war, an der Befragung teilzunehmen. Generell wurde über den ganzen Tag verteilt angerufen, vermehrt allerdings am späten Nachmittag und abends, um auch berufstätige Personen befragen zu können, siehe auch Abbildung 2.2. Um eine Verzerrung hinsichtlich des Geschlechts der befragten Person zu verringern, wurde einerseits sowohl nach dem Haushaltsvorstand als auch regelmäßig nach einem männlichen Haushaltsmitglied gefragt. Da für die Teilnahme am CATI der SOEP-CoV-Studie erforderlich war, dass die zu befragende Person zum Zeitpunkt der Befragung mindestens 18 Jahre alt war, gingen auch nur SOEP-Haushaltsmitglieder in die Modellierung ein, die dieses Kriterium erfüllten. Außerdem wurden zur Modellierung nur Personen aus Haushalten berücksichtigt, in denen mindestens zwei volljährige Personen leben, da in erfolgreich kontaktierten 1-Personen- oder Alleinerziehendenhaushalten eindeutig ist, welche Person die Fragen beantwortet.

Abbildung 4.5 zeigt die geschätzten Koeffizienten und deren Konfidenzintervalle für das Modell mit cloglog-Link, das genutzt wurde, um hinsichtlich Verzerrungen auf Personenebene zu korrigieren. Mit Blick auf die Selektion innerhalb der teilnehmenden Mehrpersonenhaushalte zeigt sich, dass Personen im Alter von 18 bis 24 Jahren seltener an der CATI-Befragung teilnehmen als Personen höheren Alters. Ebenso weisen Personen mit Abitur und Personen der Altersgruppen “65 bis 69” und “70 Jahre und älter” eine niedrigere Teilnahmewahrscheinlichkeit auf als Personen ohne Abitur bzw. Personen im Alter von 25 bis 68 auf. Gleiches gilt für Männer sowie für vollzeiterwerbstätige Personen.

Hingegen nehmen Personen mit Universitätsabschluss oder systemrelevanten Berufen mit einer höheren Wahrscheinlichkeit am CATI teil. Das gleiche gilt für Personen, die in einem 2-Personen Haushalt leben im Vergleich zu Personen, die in Haushalten mit mehr als 2 Personen leben. Personen mit einer mittleren Reife nehmen ebenso mit einer höheren Wahrscheinlichkeit am CATI teil, wie Personen, die bereits auf Covid-19 getestet wurden und deren Ergebnis negativ ausgefallen ist. Schließlich nimmt übermäßig häufig der Haushaltsvorstand der Befragung von 2018 an der CATI-Befragung teil.

Abbildung B.5 in Anhang B zeigt die vom Modell geschätzten Teilnahmewahrscheinlichkeiten an der CATI-Befragung auf Personenebene.

Koeffizientenplot des Modells zur Korrektur an der CATI-Teilnahme in der SOEP-CoV-Studie. (HH: Haushalt.)

Abbildung 4.5: Koeffizientenplot des Modells zur Korrektur an der CATI-Teilnahme in der SOEP-CoV-Studie. (HH: Haushalt.)

5 Trimmen und Randanpassung

Mit dem Ziel die statistische Effizienz von gewichteten Analysen zu verbessern, wurden die Gewichte getrimmt. Durch das Trimmen der Gewichte wird die Varianz reduziert und somit einer möglichen Verzerrung gewichteter Analysen durch einzelne Beobachtungen mit großen Gewichten entgegengewirkt. Die Gewichte wurden hierbei nicht bei einem bestimmten Wert gekappt, sondern es findet eine Umverteilung der Gewichte nach der “Weight Distribution” Methode statt (vgl. Potter 1990).

Dieser Methode liegt die parametrische Annahme zugrunde, dass die Gewichte \(w\) einer inversen Beta-Verteilung mit Verteilungsfunktion \(F_w\) folgen. Die beiden Parameter der Verteilung werden aus den Gewichten geschätzt und es wird ein Maximalwert \(\tau\) berechnet, so dass \(1 – F_w (\tau) = 0,99\). Gewichte, die diesen Wert \(\tau\) überschreiten, werden an diesem Maximalwert getrimmt und die überschüssige Masse wird auf die übrigen Gewichte verteilt. Nun wird für die derart getrimmten Gewichte, analog zum obigen Vorgehen, ein neuer Maximalwert \(\hat{\tau}\) berechnet. Liegen nun Gewichte vor, die größer sind als \(\hat{\tau}\), werden diese am neuen Maximalwert getrimmt und die verbleibende Masse wird wiederum auf alle Gewichte kleiner \(\hat{\tau}\) umverteilt. Dieses Verfahren wird iterativ so lange wiederholt, bis keines der getrimmten Gewichte mehr größer ist als der neue Maximalwert oder anders ausgedrückt bis \(\tau = \hat{\tau}\). Das Trimmen der Gewichte kam zum einen auf der Haushaltsebene und zum anderen auf Ebene der Personen im CATI-Gewichtungsschritt zur Anwendung.

Um Stichprobenfehler und Undercoverage auszugleichen, werden alle Gewichte in einem letzten Schritt an bekannte Randverteilungen angepasst. Hierzu wurde die in Deville, Särndal, and Sautory (1993) beschriebene Raking Prozedur angewandt. Da für das Jahr 2020 noch keine Randverteilungen vom Statistischen Bundesamt bereitgestellt werden können (z.B. durch den entsprechenden Mikrozensus), wurden für die Randanpassungen auf Haushaltsebene und für alle Personen des Haushaltes die letzten vorhandenen Randverteilungen des Mikrozensus’ aus dem Jahr 2018 verwendet. Ein dritter zur Verfügung gestellter Gewichtungsfaktor rechnet nur die Kontaktpersonen hoch. Da es sich dabei ausschließlich um erwachsene Personen handelt und uns für diese Population keine Ränder des Mikrozensus vorlagen, wurden die entsprechenden Randverteilungen für Erwachsene auf Basis der SOEP-Daten von 2018 geschätzt.

Auf Haushaltsebene wurden Verteilungen zur Anzahl der Haushalte nach Bundesland, Haushaltsgröße, Gemeindegrößenklasse, selbstbewohntem Eigentum, Haushaltstyp sowie zum letzten Zuzugsjahr eines Haushaltsmitglieds aus dem Ausland zur Randanpassung genutzt. Der entsprechende Randanpassungsschritt erfolgte nach dem Gewichtungsschritt, der Verzerrungen auf Haushaltsebene bei einem realisierten Interview in einem Haushalt ausgleicht, und dem Trimmen der Gewichte. Die Ränder auf Haushaltsebene samt ihrer Ausprägungen und der zugehörigen Häufigkeiten sind in Tabelle A.2 in Anhang A aufgeführt.

Auf der Personenebene wurden Verteilungen zur Anzahl der Personen in der Grundgesamtheit nach Alter, Geschlecht, Staatsbürgerschaft (Deutsch vs. andere) zur Randanpassung der Gewichte herangezogen. Diese Randanpassung erfolgte an den Personengewichten, für alle Haushaltsmitglieder in einem realisierten Haushalt. Die Ränder auf Personenebene in realisierten Haushalten samt ihrer Ausprägungen und der zugehörigen Häufigkeiten sind in Tabelle A.3 in Anhang A aufgeführt. Für die Randanpassung im Anschluss an den CATI-Gewichtungsschritt werden die Ränder aus Tabelle A.4 in Anhang A zur Anpassung verwendet.

6 Zusammenfassung der Gewichte

Tabelle 6.1 weist für die einzelnen Tranchen die Anzahl der Haushalte und der Personen aus, die an der SOEP-CoV-Studie teilgenommen haben. Da je Haushalt nur eine Person interviewt wurde, ist die Zahl der am CATI teilnehmenden Personen identisch mit der Zahl der Haushalte. Darüber hinaus enthält die Tabelle Angaben dazu, wie viele Haushalte und darin lebende Personen ein Gewicht mit dem Wert 0 aufweisen. Da je Haushalt nur eine Person am CATI teilnimmt, weisen die CATI-Gewichte für die übrigen Personen im Haushalt ebenfalls den Wert 0 auf. Gewichte mit dem Wert 0 treten auf, da in der Teilstichprobe D (1994/5 Migration (1984-1994, West)) ein Schneeballverfahren zur Anwendung kam. Aufgrund dessen können für bestimmte Haushalte keine Inklusionswahrscheinlichkeiten und somit auch keine Gewichte berechnet werden. Hierbei sind Haushaltsgewichte mit hhrf gekennzeichnet, Gewichte für alle Haushaltsmitglieder mit phrf und die Gewichte von Personen, die im Rahmen der SOEP-CoV-Studie mittels CATI befragt werden konnten, mit phrf_cati.

Tabelle 6.1: Zusammenfassende Informationen zu den Gewichtungsdaten.
Anzahl der
Anzahl der Gewichte mit Wert 0
Tranche Haushalte Personen hhrf phrf phrf_cati
1 1.689 4.126 7 14 2.444
2 1.932 4.947 9 21 3.024
3 978 2.443 1 1 1.466
4 632 1.584 1 4 953
5 309 723 0 0 414
6 303 756 3 5 456
7 288 750 1 3 463
8 298 722 5 11 429
9 265 665 0 0 400
1-9 6.694 16.716 27 59 10.049

Die nachfolgende Tabelle 6.2 zeigt die Verteilung der verschiedenen Gewichte (phrf, phrf und phrf_cati) für die in Tabelle 6.1 berichteten Fallzahlen. Bei der Berechnung der entsprechenden Statistiken wurden Gewichte mit dem Wert 0 ausgeschlossen.

Tabelle 6.2: Verteilung der verschiedenen Gewichte nach Tranche.
Gewicht Tranche Minimum Median Mittelwert Maximum Standardabweichung Summe
hhrf 1 48 3.697 6.279 62.921 7.595 10.562.046
hhrf 2 8 3.193 5.473 59.144 6.563 10.524.192
hhrf 3 35 3.931 6.371 62.995 7.741 6.224.776
hhrf 4 80 3.688 6.537 58.421 8.154 4.125.110
hhrf 5 131 3.713 6.894 56.348 8.812 2.130.310
hhrf 6 49 3.521 6.098 38.746 7.227 1.829.350
hhrf 7 18 3.630 6.745 49.683 8.130 1.935.906
hhrf 8 20 4.436 7.372 51.321 8.691 2.159.963
hhrf 9 77 3.617 7.118 65.067 9.037 1.886.347
hhrf 1-9 8 3.581 6.206 65.067 7.592 41.378.000
phrf 1 43 2.692 4.956 75.018 6.798 20.378.307
phrf 2 6 2.449 4.250 77.311 5.579 20.936.930
phrf 3 29 2.900 5.165 54.870 6.904 12.613.619
phrf 4 74 2.667 5.237 76.366 7.663 8.274.771
phrf 5 107 2.916 5.655 57.986 7.883 4.088.392
phrf 6 46 2.539 4.722 49.384 6.330 3.545.887
phrf 7 17 2.770 5.534 64.162 7.644 4.133.597
phrf 8 16 3.157 5.797 60.224 7.634 4.121.793
phrf 9 63 2.571 5.293 57.744 7.532 3.519.703
phrf 1-9 6 2.648 4.900 77.311 6.727 81.613.000
phrf_cati 1 60 5.674 10.254 92.106 12.478 17.246.453
phrf_cati 2 3 5.463 9.574 98.090 11.601 18.410.223
phrf_cati 3 49 6.263 10.790 92.106 12.925 10.542.234
phrf_cati 4 159 6.131 10.754 80.088 12.865 6.785.625
phrf_cati 5 206 6.118 11.460 98.090 13.668 3.540.989
phrf_cati 6 48 5.954 10.487 65.970 12.309 3.146.210
phrf_cati 7 26 6.186 11.244 92.106 13.966 3.227.107
phrf_cati 8 38 7.091 11.622 72.292 13.117 3.405.221
phrf_cati 9 127 6.909 12.082 72.292 13.812 3.201.754
phrf_cati 1-9 3 5.862 10.425 98.090 12.552 69.505.815

7 Ableiten eigener Gewichtungsfaktoren

Mit den SOEP-CoV-Daten ist eine Vielzahl von Analysen an unterschiedlichsten Analysemengen möglich. Für jede potentielle Analysemenge eigene Gewichte zur Verfügung zu stellen, übersteigt den Rahmen des Machbaren. Dennoch sollen und müssen die zur Verfügung gestellten Gewichte der gesamten SOEP-CoV-Stichprobe für statistische Auswertungen, die auf Populationsaussagen abzielen, genutzt werden; wenn auch nur um zu prüfen, ob die Gewichte relevant für die Berechnung von Populationsstatistiken sind (z.B. durch den simplen Vergleich von gewichteten und ungewichteten Statistiken). Die SOEP-CoV-Gewichte wurden für die gesamte Stichprobe (der neun SOEP-CoV-Tranchen) an Haushalten bzw. Personen, die an der CATI-Befragung teilgenommen haben, erzeugt. Somit stellen sie Hochrechnungsfaktoren für genau diese Stichprobe bzw. für eine Zufallsauswahl aus dieser Stichprobe dar. Das bedeutet, dass für jede Analysemenge, die diese Voraussetzung nicht erfüllt, Adjustierungsfaktoren berechnet werden müssen, damit Hochrechnungen auf die Grundgesamtheit der SOEP-CoV-Stichprobe möglich sind.

  • Um in einem ersten Schritt zu prüfen, ob die SOEP-CoV-Gewichte für eine Teilstichprobe der SOEP-CoV-Stichprobe verwendet werden können und — falls dies nicht ohne weiteres möglich ist — entsprechende Adjustierungsfaktoren abzuleiten, muss eine Selektivitätsanalyse durchgeführt werden:
  • Hierbei müssen mindestens alle Variablen, die in die geplante Analyse aufgenommen werden sollen, als erklärende Variablen in ein logistisches Regressionsmodell (oder eine probit oder cloglog Regression) einfließen.
  • Die abhängige Variable dieses Selektionsmodells ist ein Indikator (kodiert auf 0 und 1), der angibt ob im Vergleich zur gesamten SOEP-CoV-Stichprobe eine Datenzeile Teil der Analysemenge ist (y = 1) oder nicht (y = 0).
  • Das Selektionsmodell umfasst somit genauso viele Datenzeilen wie es in SOEP-CoV Beobachtungen gibt.
  • Zeigt nun keine der Analysevariablen einen signifikanten (d.h. p < 0,05) und gleichzeitig bedeutungsvollen Effekt (d.h. \(\beta > 0,01\)) hinsichtlich der Zuordnung zur Analysemenge, ist die betrachtete Teilstichprobe eine im Hinblick auf die Analysevariablen zufällige Auswahl aus der gesamten SOEP-CoV-Stichprobe. Die originalen SOEP-CoV-Gewichte können zur Hochrechnung dieser Teilstichprobe auf die Grundgesamtheit genutzt werden. Hierbei gilt zu beachten, dass gewichtete Angaben dann in Summe natürlich nicht die gesamte Populationsgröße ergeben, sondern eben nur auf die Teilpopulation, auf die sich die Analyse bezieht.
  • Ergibt die Selektivitätsanalyse allerdings Verzerrungen der Teilstichprobe hinsichtlich der Analysevariablen (d.h. gibt es signifikante und bedeutungsvolle Effekte in der Selektivitätsanalyse), ist eine Korrektur der SOEP-CoV-Gewichte erforderlich, bevor sie zu Hochrechnungszwecken herangezogen werden können. Diese Korrektur der SOEP-CoV-Gewichte erfolgt über die Multiplikation mit einem Adjustierungsfaktor, der sich wiederum aus der durchgeführten Selektivitätsanalyse ergibt.
  • Konkret heißt das: Alle Analysevariablen, die sich als signifikant und gleichzeitig bedeutungsvoll herausgestellt haben, fließen in eine neue Selektivitätsanalyse ein. Analysevariablen, die in der zuvor berechneten Selektivitätsanalyse nicht signifikant und/oder bedeutungsvoll waren, werden hierbei außer Acht gelassen (um eine unnötige Varianzerhöhung in den zu erzeugenden Adjustierungsfaktoren zu vermeiden). Die abhängige Variable der neuen Selektivitätsanalyse ist identisch mit der der zuvor berechneten, auch die Stichprobengröße bleibt unverändert.
  • Auf Basis der geschätzten (neuen) Selektivitätsanalyse müssen nun für jede Datenzeile Wahrscheinlichkeiten geschätzt (bzw. vorhergesagt) werden der Analysemenge anzugehören. Das kann in Stata mit dem Befehl predict pr getan werden und in R mit dem Befehl predict() unter Berücksichtigung des Arguments type = "response". Nun werden der Analysemenge die vorhergesagten Wahrscheinlichkeiten für eine Zugehörigkeit zur originalen SOEP-CoV-Stichprobe zugespielt. Die Inverse dieser Wahrscheinlichkeiten gibt den Adjustierungsfaktor an, der mit den SOEP-CoV-Gewichten zu multiplizieren ist, um für Verzerrungen im Vergleich zur gewichteten Ausgangsstichprobe der SOEP-CoV-Studie zu korrigieren. Mit anderen Worten, durch die Multiplikation der SOEP-CoV-Gewichte, die zur Analysemenge gehören, mit der inversen vorhergesagten Wahrscheinlichkeit ergibt sich das gesuchte adjustierte Gewicht, das zur Berechnung von Populationsstatistiken hergezogen werden kann.
  • Anmerkung: Es ist in jedem Fall angeraten, zu überprüfen wie gut das berechnete Selektionsmodell zwischen Zugehörigkeit und Nicht-Zugehörigkeit zur Analysemenge diskriminieren kann, z.B. durch die Nutzung entsprechender Boxplots: ein Boxplot gibt die Verteilung der (vorhergesagten) Wahrscheinlichkeiten für die Analysemenge an und ein Box-Plot zeigt die (vorhergesagten) Wahrscheinlichkeiten für den Teil der SOEP-CoV-Stichprobe, der nicht Teil der Analysemenge ist. Generell sollte der erste Boxplot eine Verteilung nahe der 1 anzeigen, der zweite eine Verteilung nahe der 0 und die Inter-Quartile-Ranges beider Boxplots sollten möglich wenig Überschneidungen in ihrem Wertebereich aufweisen. Ist dies nicht der Fall, diskriminiert das verwendete Modell nicht gut und die Hinzunahme weiterer erklärender Variablen, die den Selektionsmechanismus (besser) beschreiben, der die Analysemenge erzeugt hat, ist sinnvoll.

8 Anmerkungen

9 Literatur

Auguie, Baptiste. 2017. GridExtra: Miscellaneous Functions for „Grid“ Graphics. https://CRAN.R-project.org/package=gridExtra.

Deville, Jean-Claude, Carl-Erik Särndal, and Olivier Sautory. 1993. “Generalized Raking Procedures in Survey Sampling.” Journal of the American Statistical Association 88 (423): 1013–20. https://doi.org/10.1080/01621459.1993.10476369.

Kroh, Martin, Rainer Siegers, and Simon Kühne. 2015. “Gewichtung und Integration von Auffrischungsstichproben am Beispiel des Sozio-oekonomischen Panels (SOEP).” In Nonresponse Bias: Qualitätssicherung Sozialwissenschaftlicher Umfragen, edited by Jürgen Schupp and Christof Wolf, 409–44. Wiesbaden: Springer Fachmedien Wiesbaden. https://doi.org/10.1007/978-3-658-10459-7_13.

Kühne, Simon, Martin Kroh, Stefan Liebig, and Sabine Zinn. 2020. “The Need for Household Panel Surveys in Times of Crisis: The Case of SOEP-CoV.” Survey Research Methods 14 (2): 195–203. https://doi.org/10.18148/srm/2020.v14i2.7748.

Potter, Frank J. 1990. “A Study of Procedures to Identify and Trim Extreme Sampling Weights.” In Proceedings of the American Statistical Association, Section on Survey Research Methods, 225–30. American Statistical Association Washington, DC. http://www.asasrms.org/Proceedings/papers/1990_034.pdf.

R Core Team. 2020. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.

Robinson, David, and Alex Hayes. 2020. Broom: Convert Statistical Analysis Objects into Tidy Tibbles. https://CRAN.R-project.org/package=broom.

Siegers, Rainer, Veronika Belcheva, and Tobias Silbermann. 2020. “SOEP-Core v35 Documentation of Sample Sizes and Panel Attrition in the German Socio-Economic Panel (SOEP) (1984 until 2018).” SOEP Survey Papers 826. Berlin: DIW/SOEP. https://www.diw.de/documents/publikationen/73/diw_01.c.745900.de/diw_ssp0826.pdf.

The American Association for Public Opinion Research. 2016. Standard Definitions: Final Dispositions of Case Codes and Outcome Rates for Surveys. 9th ed. AAPOR.

Wickham, Hadley, Mara Averick, Jennifer Bryan, Winston Chang, Lucy D’Agostino McGowan, Romain François, Garrett Grolemund, et al. 2019. “Welcome to the tidyverse.” Journal of Open Source Software 4 (43): 1686. https://doi.org/10.21105/joss.01686.

Xie, Yihui, J.J. Allaire, and Garrett Grolemund. 2018. R Markdown: The Definitive Guide. Boca Raton, Florida: Chapman; Hall/CRC. https://bookdown.org/yihui/rmarkdown.

Zhu, Hao. 2019. KableExtra: Construct Complex Table with ’Kable’ and Pipe Syntax. https://CRAN.R-project.org/package=kableExtra.

Anhang

A Tabellen

Tabelle A.1: Liste der Merkmale, die im Rahmen der Gewichtung geprüft wurden.
Variable Datensatz Variablenlabel
lb0111 biol Mutter berufl. Ausb., Studium abgeschl.
lb0110 biol Vater berufl. Ausb., Studium abgeschl.
NumberOfContacts CoV_CATIerg_Brutto Anzahl der Kontaktversuche
anz_festnetz CoV_CATIerg_Brutto Anzahl Festnetznummern
anz_mobil CoV_CATIerg_Brutto Anzahl Mobilfunknummern
ResponseLabel CoV_CATIerg_Brutto Response Label
tranche CoV_Contact_Log CATI-Tranche
fest_mobil CoV_Contact_Log Festnetznummer oder Mobilfunknummer
ContactDate CoV_Contact_Log Kontaktdatum- und Uhrzeit
ResponseStatus CoV_Contact_Log Response Status
Personen DESTATIS (GENESIS-Online Tabelle: 12411-0015) Fortgeschriebener Bevölkerungsstand am 31.12.2018
hlc0128 hl Ae Kreditabzahl./Monat in D
hlc0175 hl Ae Sparbetrag/Monat
hlc0064_v2 hl ALG II, Sozialgeld, Unterhaltskosten heute (Ja/Nein) [2010-2018]
hlc0065 hl ALG2, Sozialgeld heute Betrag
hlc0054 hl ALG2, Sozialgeld im letzten Jahr, Betrag pro Monat
hlf0197 hl Anzahl Buecher im HH
hlj0005 hl Art der Unterkunft
hlj0033 hl AsylbLG Betrag/Monat
hlc0027_v2 hl Ausgabenueberschuss Hoehe (Monat) [2016-2018]
hlf0180 hl Auto im HH
hlj0038 hl Bankkonto
hlc0105 hl Bausparvertrag Vorjahr
hlj0043 hl Bedarf, nicht ueber Gutscheine abgedeckt
hlj0042 hl Bedarfsdeckung ueber Gutscheine
hlj0041 hl Bedarfsdeckung ueber Sachleistungen
hlf0148 hl Beintraechtigung d. Laermbelaestigung
hlf0149 hl Beintraechtigung d. Luftverschmutzung
hlf0150 hl Beintraechtigung d.Mangel a.Gruenflaeche
hlj0007 hl Bestehender Haushalt oder neuer Haushalt
hlc0190 hl Betrag Bildungspaket 2016/Monat
hlc0192 hl Betrag Bildungspaket heute/Monat
hlc0151 hl Betrag Einnahmen (Wertanlagen) 2015 im Ausland
hlc0150 hl Betrag Einnahmen (Wertanlagen) 2015 in D
hlf0601 hl Betrag Grundsteuer fuer Grundbesitz 2015
hlf0069_v5 hl Betrag Heizkosten/Monat [2002-2014,2016-2018]
hlf0600 hl Betrag Instandhaltung und Modernisierung 2015
hlc0045_v2 hl Betrag Kindergeld heute/Monat (Euro) [2002-2018]
hle0016 hl Betrag Kosten fuer Pflege/Monat von Personen nicht im HH
hlf0332 hl Betrag Pflegekosten im Monat
hlc0179 hl Betrag/Gegenwert erbschaft 2015
hlc0183 hl Betrag/Gegenwert Lotteriegewinn 2015
hlc0181 hl Betrag/Gegenwert Schenkung 2015
hlc0111_v2 hl Betriebs-/Instandhaltungskosten Betrag Vorjahr (Euro) [2002-2018]
hlc0104 hl Betriebsvermoegen Vorjahr
hlf0071_v1 hl Beurteilung der Wohnungsgroesse [1984,1998-2018]
hlf0262 hl Durchschnittliche Kosten im Monat
hlc0025_v2 hl Einnahmeueberschuss Hoehe (Monat) [2016-2018]
hlc0107 hl Festverzinsl. Wertpapiere Vorjahr
hlf0190 hl Freunde zum Essen einladen 1/Monat
hlf0531 hl Garage/Stellplatz
hlc0063 hl Grundsicherung im Alter Betrag pro Monat
hlc0071 hl Grundsicherung im Alter heute Betrag
hlf0178_v1 hl Haushalt: Internet [2005,2007,2011,2013,2015-2018]
hlc0006_v3 hl HH-Nettoeinkommensgruppen [2003-2018]
hlc0068_v2 hl Hilfe Lebensunterhalt Betrag (Euro) [2002-2018]
hlc0055_v1 hl Hilfe Lebensunterhalt Vorjahr [1984,1991,2010-2018]
hlc0059_v2 hl Hilfe Lebensunterhalt Vorjahr (Betrag im Monat) (Euro) [2002-2018]
hlf0291 hl Hilfe-,Pflegebeduerft. Person im HH
hlc0114_v3 hl Hoehe Abzahlung Kredite (selbst und andere HH-Mitglieder) (Euro) [2011-2018]
hlf0074_v2 hl Hoehe der monatlichen Miete (DM) [2002-2018]
hlc0197 hl Hoehe des Betrags nach dem AsylbLG im letzten Kalenderjahr
hlf0078 hl Hoehe durchschnittl. Stromkosten im Monat
hlf0090_v2 hl Hoehe Heizkosten letzt.Jahr (Euro) [2002-2014,2016-2018]
hlf0084 hl Hoehe Stromkosten letztes Jahr
hlf0178_v3 hl Internetanschluss [2016-2017]
hlk0057 hl Interviewdauer muendlich
hlk0058 hl Interviewdauer schriftlich
hlf0091_v3 hl Jaehrliche Nebenkosten (EURO) [2002-2014,2016-2018]
hlf0188 hl Jaehrliche Urlaubsreise
hlc0093 hl Keine Wertanlagen Vorjahr
hlc0042_v2 hl Kindergeld letzt.J Betrag(Monat) (Euro) [2002-2018]
hlc0051_v2 hl Kinderzuschlag Betrag Monat Vorjahr (Fragenpraezisierung) [2010-2018]
hlc0047_v2 hl Kinderzuschlagbezug heute Betrag (mit Fragepraezisierung) [2010-2018]
hlj0004_v2 hl Leben auslaend. Familien im Wohngebiet [2014]
hlc0106 hl Lebensversicherung Vorjahr
hlc0079_v2 hl Leistungen der Pflegeversicherung (Betrag pro Monat) (Euro) [2002-2018]
hlc0008_v2 hl Miet- u.Pachteinnahmen Betrag Vorjahr (Euro) [2002-2018]
hlf0001_v3 hl Miete oder Eigentum (auch Altersheim) [1999-2018]
hlj0029 hl Miete/Monat
hlj0017 hl Miete/Monat
hlk0060 hl Monat des Interviews
hlf0081_v2 hl Monatl Hoehe der Umlagen (DM) [2002-2014,2016-2018]
hlf0088_v2 hl Monatl Zins-,Tilgungszahlungen (Euro) [2002-2018]
hlc0005_v2 hl Monatliches HH-Netto-Einkommen (Euro) [2002-2018]
hlf0186 hl Notfallruecklagen
hli0137 hl Oekostromtarif
hlc0090_v2 hl Pflegevers. Betrag (Euro) [2002-2018]
hlc0085_v6 hl Pflegevers. Leistungen [2010-2018]
hlf0019_v1 hl Qm Wohnflaeche [1984,1998-2018]
hlf0107_v2 hl Seit wann in dieser Wohnung (Viersteller) [1999-2018]
hlc0108 hl Sonstige Wertpapiere Vorjahr
hlc0119_v2 hl Sparbetrag monatlich [2015-2018]
hlc0173 hl Sparbetrag/Monat
hlc0098 hl Sparbuch Vorjahr
hlc0010 hl Steuerlich absetzten, Betrag Vorjahr
hlf0239_v4 hl Telefon-Festnetzanschluesse [2016-2018]
hlc0112_v2 hl Tilgungszahlungen und Zinsen Betrag Vorjahr (Euro) [2002-2018]
hlf0523 hl Veraenderung der Wohnsit.
hlc0024_v2 hl Verhaeltnis Einnahmen zu Ausgaben (Monat) [2016-2018]
hlc0095 hl Verluste steuerlich absetzen, Betrag
hlc0083_v1 hl Wohngeld heute (ja/nein) [1995-1998,2010-2018]
hlc0082_v2 hl Wohngeld,Lastenzuschuss pro Monat (Euro) [2002-2018]
hlc0084_v2 hl Wohngeldbezug heute Betrag (Euro) [2002-2018]
hlj0010 hl Wohnung – Selbst eingerichtet oder moebliert
hlf0030 hl Wohnung mit Balkon,Terasse
hlf0032 hl Wohnung mit Garten,-benutzung
hlf0031 hl Wohnung mit Keller,Abstellraeume
hlf0035 hl Wohnung mit Sonnenkollekt., Solarenergie
hlc0013_v2 hl Zins-u. Dividendeneinnahmen Vorjahr (Euro) [2002-2018]
hlf0059_h hl Zustand des Hauses in dem man wohnt [harmonisiert]
hlf0621 hl Zwei paar Strassenschuhe
ha_tko_k_internet Microm – Hausebene Affinitaet fuer Internetnutzung
ha_tme_k_uebertag Microm – Hausebene Affinitaet Lesen ueberregionaler Tageszeitung
ha_mso_k_ausland Microm – Hausebene Ausland
ha_mso_k_familie Microm – Hausebene Familie
ha_mmo_k_fluktu Microm – Hausebene Fluktuation
ha_mbe_k_haustyp Microm – Hausebene Haustyp
ha_mso_k_status Microm – Hausebene Status
ha_mmo_k_volumen Microm – Hausebene Umzugsvolumen
p8_met_p_spaetaus Microm – PLZ8-Ebene Anteil der Einwohner an Spaetaussiedlern aus der frueheren Sowjetunion in %
p8_met_p_islam Microm – PLZ8-Ebene Anteil der Einwohner aus aussereurop. islamischen Staaten in %
p8_met_p_balkan Microm – PLZ8-Ebene Anteil der Einwohner aus dem Balkangebiet in %
p8_met_p_tuerkei Microm – PLZ8-Ebene Anteil der Einwohner aus der Tuerkei in %
p8_met_p_deutschl Microm – PLZ8-Ebene Anteil der Einwohner aus Deutschland in %
p8_met_p_griechen Microm – PLZ8-Ebene Anteil der Einwohner aus Griechenland in %
p8_met_p_italien Microm – PLZ8-Ebene Anteil der Einwohner aus Italien in %
p8_met_p_osteurop Microm – PLZ8-Ebene Anteil der Einwohner aus Osteuropa in %
p8_met_p_spanport Microm – PLZ8-Ebene Anteil der Einwohner aus Spanien/Portugal/Lateinamerika in %
p8_met_p_asien Microm – PLZ8-Ebene Anteil der Einwohner Sued-/Ost-/Suedostasiens in %
p8_met_p_afrika Microm – PLZ8-Ebene Anteil der Einwohner suedlich der Sahara in %
p8_met_p_uebrige Microm – PLZ8-Ebene Anteil der uebrigen Einwohner in %
st_kkr_w_prohh Microm – Straßenabschnittebene durchschnittliche Kaufkraft pro HH in dem PLZ8-Gebiet in Euro
pgpbbil01 pgen Berufl. Bildungsabschluss
pgpbbil02 pgen Hochschulabschluss
germborn pgen In Deutschland geboren
migback pgen Migrationshintergrund
pgpsbil pgen Schulabschluss
plh0136 pl 10.000EUR geschenkt, Anteil ausgeben
plh0134 pl 10.000EUR geschenkt, Anteil sparen
plh0135 pl 10.000EUR geschenkt, Anteil verschenken
plc0043_v2 pl
  1. Monatsgehalt Brutto Vorjahr (Euro) [2002-2018]
plc0045_v2 pl
  1. Monatsgehalt Brutto Vorjahr (Euro) [2002-2018]
plj0022 pl
  1. Staatsangehoerigkeit vorhanden
plb0205_v2 pl Abendarbeit, zwischen 19 und 22 Uhr (unregelmaessig) [1995-2017]
plc0041_v2 pl Abfindung Hoehe (Euro) [2002-2018]
plb0114 pl Abschalten von der Arbeit faellt leicht
plh0206i19 pl Aktiv Verluste ausgleichen
plj0680_v1 pl Aktueller Aufenthaltstitel [2016-2017]
plc0139 pl ALG_II Sozialgeld Monate Vorjahr
plh0166 pl Allg. Lebenszufriedenheit in einem Jahr
plh0011_v2 pl Allgemeine Parteienpraeferenz [1984-2018]
plj0078 pl Als Deutscher fuehlen
plc0240_v2 pl Altersrente betriebliche Altersversorgung (EURO) [2003-2018]
plc0235 pl Altersrente etc Monate Vorjahr
plc0249_v2 pl Altersrente sonstige (in EURO) [2003-2018]
plc0243_v2 pl Altersrente Unfallversicherung (in EURO) [2003-2018]
plj0671_v1 pl Anhoerung schon stattgefunden [2016-2017]
pld0047 pl Anzahl enge Freunde
plb0570 pl Anzahl Mitarbeiter
plh0212 pl Arbeite gruendlich
plb0021 pl Arbeitslos gemeldet
plc0130_v2 pl Arbeitslosengeld (M3-M5) [2016-2018]
plc0137_v2 pl Arbeitslosengeld Betrag Vorjahr (Euro) [2002-2018]
plc0131_v2 pl Arbeitslosengeld Brutto letzter Monat (Euro) [2002-2018]
plc0136 pl Arbeitslosengeld Monate (Anz.) Vorjahr
plc0129_v2 pl Arbeitslosenhilfe Betrag (Euro) [2002-2005,2017]
plb0211 pl Arbeitszeitregelungen
ple0097 pl Art der Krankenversicherung
ple0013 pl Asthma
plj0564 pl AsylbLG Leistungen
ple0187 pl Ausgebranntsein (Burnout)
ple0028 pl Ausgeglichen letzten 4 Wochen
plc0171_v2 pl BAfoeG, Stipendium Betrag Vorjahr (Euro) [2002-2018]
plc0170 pl BAfoeG, Stipendium Monate Vorjahr
plc0168_v2 pl BAfoeG/Stipendium/BAB Brutto letzter Monat (Euro) [2002-2018]
plc0236_v2 pl Beamtenversorgung Rente Brutto/Monat (Euro) [2003-2018]
plc0279_v2 pl Beamtenversorgung Witwen-/Waisenrente Brutto/Monat (Euro) [2003-2018]
pld0095 pl Befreundete Person 1: Alter
plj0057 pl Befreundete Person 1: aus selben Land wie Befragungsperson
pld0092 pl Befreundete Person 1: Geschlecht
plj0054 pl Befreundete Person 1: Herkunft
pld0101 pl Befreundete Person 1: hoechster Bildungsabschluss
pld0098 pl Befreundete Person 1: ist erwerbstaetig, in Ausbildung, in Rente
pld0089_v1 pl Befreundete Person 1: Verwandtschaft (unregelmaessig) [1988-2016]
pld0096 pl Befreundete Person 2: Alter
plj0058 pl Befreundete Person 2: aus selben Land wie Befragungsperson
pld0093 pl Befreundete Person 2: Geschlecht
plj0055 pl Befreundete Person 2: Herkunft
pld0102 pl Befreundete Person 2: hoechster Bildungsabschluss
pld0099 pl Befreundete Person 2: ist erwerbstaetig, in Ausbildung, in Rente
pld0090_v2 pl Befreundete Person 2: Verwandtschaft (FID) (unregelmaessig) [1988-2016]
pld0097 pl Befreundete Person 3: Alter
plj0059 pl Befreundete Person 3: aus selben Land wie Befragungsperson
pld0094 pl Befreundete Person 3: Geschlecht
plj0056 pl Befreundete Person 3: Herkunft
pld0103 pl Befreundete Person 3: hoechster Bildungsabschluss
pld0100 pl Befreundete Person 3: ist erwerbstaetig, in Ausbildung, in Rente
pld0091_v1 pl Befreundete Person 3: Verwandtschaft (unregelmaessig) [1988-2016]
plb0037_v3 pl Befristet/unbefristet [2006-2018]
plj0566 pl Behoerdengaenge
plb0036_v2 pl Bei jetzigem Arbeitgeber beschaeftigt [1999-2018]
plj0175 pl Beide Eltern in Deutschland geboren
plh0206i05 pl Beleidigendes Verh. bei Beleidigungen
plc0311 pl Bereits in Rente
plh0206i01 pl Bereitschaft Gefallen zu erwidern
plh0206i06 pl Bereitschaft Kosten aufzunehmen um Hilfe zurueckzugeben
plb0586 pl Berufl. Stellung Selbstaendige
plb0064_v2 pl Berufliche Stellung Angestellte [1991-2018]
plh0206i04 pl Besondere Anstrengung Hilfe zurueckzugeben
plj0061 pl Besuch bei Auslaendern letzte 12 Monate
plj0060 pl Besuch bei Deutschen letzte 12 Monate
plj0322 pl Besuch Herkunftsland i.d. letzt. 2 J.
plj0063 pl Besuch von Auslaendern letzte 12 Monate
pli0091_v1 pl Besuch von Kino,Pop,Jazz Konzerte,Disco (kurz) (unregelmaessig) [1985-2017]
pli0090_v2 pl Besuch von Oper, klass. Konzerte, Theater, Ausstellungen (kurz) (unregelmaessig)
pli0097_v2 pl Beteilig. Parteien, Kommunalpolitik, Buergerinitiativen (kurz) (unregelmaessig)
plj0132_v2 pl Betrag an Eltern/Schwiegereltern (Euro) [2002-2018]
plj0136_v2 pl Betrag an Kinder (Euro) [2002-2018]
plj0148_v2 pl Betrag an nicht Verwandte (Euro) [2002-2018]
plj0565 pl Betrag AsylbLG Leistungen im letzten Monat
plc0383_v2 pl Betrag Erbschaft 1.Person (Euro) (letzte 15 Jahre) [2017]
plc0393_v2 pl Betrag Erbschaft 2.Person (Euro) (letzte 15 Jahre) [2017]
plc0403_v2 pl Betrag Erbschaft 3. Person (Euro) (letzte 15 Jahre) [2017]
plc0220_v3 pl Betrag Rentenversicherung und Knappschaft (Euro) [2003-2018]
plc0128_v2 pl Betrag Sozialgeld im letzten Monat (Euro) [2002-2004,2016-2018]
plb0040 pl Betrieb d. oeffentl. Dienstes
plh0218 pl Bin eher faul
plh0219 pl Bin gesellig
plh0213 pl Bin kommunikativ
plh0221 pl Bin leicht nervoes
plh0214 pl Bin manchmal zu grob zu anderen
plh0215 pl Bin originell
plh0223 pl Bin zurueckhaltend
ple0018 pl Bluthochdruck
plj0125_v3 pl Bruder, Brueder – Entfernung [2006,2011,2016]
plc0074 pl Brutto Einkuenfte a. selbstaendiger Taetigkeit Mon. (Anz.) Vorjahr
plb0471_v2 pl Brutto Lohn als Arbeitnehmer Betrag Vorjahr (Euro) [2002-2018]
plc0016 pl Brutto Lohn als Arbeitnehmer Monate (Anzahl) Vorjahr
plh0354 pl Bruttostundenlohn unter 10
ple0022 pl Chronische Rueckenbeschwerden
ple0020 pl Demenzerkrankung
plj0618 pl Demokratie: Buergerrechte schuetzen vor staatlicher Unterdrueckung
plj0617 pl Demokratie: Menschen waehlen Regierung in freien Wahlen
plj0615 pl Demokratie: Regierung besteuert Reiche, unterstuetzt Armen
ple0019 pl Depressive Erkrankung
pld0021_v2 pl Derz. Ehepartner Entf., falls nicht i.H. [2006,2011,2016]
plg0012 pl Derzeit in Ausbildung
plb0058 pl Derzeitige Stellung Arbeiter
plb0065 pl Derzeitige Stellung Beamte
plj0014_v3 pl Deutsche Staatsangehoerigkeit [1996-2018]
ple0012 pl Diabetes
plc0545 pl Dritte Nebentaetigkeit Bruttoverdienst letzter Monat
plc0268_v3 pl Dt. Rentenvers. und Knappschaft Witwen-/Waisenrente Brut./Monat (Euro) [2003-20
ple0176 pl E-zigarette
pli0096_v2 pl Ehrenamtliche Taetigkeit in Vereinen, Verbaenden, …(kurz) (unregelmaessig) [19
plh0206i17 pl Eigene Reaktionen unter Kontrolle haben
ple0026 pl Eile, Zeitdruck letzten 4 Wochen
plj0435 pl Einfluss von Fluechtlingen auf Deutschland als Lebensort
plj0433 pl Einfluss von Fluechtlingen auf die Wirtschaft
plb0474_v2 pl Einkommen selbstaendig/freiberuflich Brutto/Monat Vorjahr (Euro) [2002-2018]
plb0477_v2 pl Einkuenfte a. Nebenerwerb Betrag Vorjahr (Euro) [2002-2018]
plc0065 pl Einkuenfte a. Nebenerwerb Monate Vorjahr
ple0009 pl Einschraenkg.im Alltgasleben wg. gesundheitl. Probleme
ple0035 pl Einschraenkung sozialer Kontakte wg. Gesundheit
plh0244 pl Einstellung bezueglich Zukunft
ple0029 pl Energie letzten 4 Wochen
plj0700 pl Englisch: Lesen
plj0699 pl Englisch: Schreiben
plb0158 pl Entfernung von Wohnung zur Arbeit in km
plc0537 pl Entnahmen aus personengesellschaften brutto letzter monat
plc0531 pl Entnahmen aus personengesellschaften brutto/monat
plj0674 pl Entscheidung ber Asylantrag
plj0677 pl Ergebnis des Asylantrags
plh0222 pl Erledige Aufgaben wirksam, effizient
plc0541 pl Erste Nebentaetigkeit Bruttoverdienst letzter Monat
plj0668 pl Erster Asylantrag
ple0040 pl Erwerbs-, Schwerbehinderung
plb0022_v9 pl Erwerbsstatus [2016-2018]
plj0140_v2 pl Euro Betrag 2016 an (geschiedenen) Ehepartner (Euro) [2002-2018]
plj0144_v2 pl Euro Betrag an sonstige Verwandte (Euro) [2002-2018]
plc0563 pl Euro Betrag Kreditschulden Ausbildung/BAfoeG
plc0557 pl Euro Gesamtwert Sachvermoegen
plc0553 pl Euro Marktwert Kraftfahrzeug
plf0088 pl Euro Verkehrswert gesamter Immobilien
plc0111 pl Finanz. Absicherung Krankheit
plk0032 pl Folgebefragungen
plj0089 pl Gedanken an Auslandsaufenthalt
plj0588 pl Gefuehl, aussen vor zu sein
plj0590 pl Gefuehl, Menschen aus dem Herkunftsland zu vermissen
plj0591 pl Gefuehl, willkommen zu sein – bei der Ankunft
plj0592 pl Gefuehl, willkommen zu sein – heute
plh0224 pl Gehe mit anderen freundlich um
plh0129 pl Geld gespendet
plc0532 pl Geldwerter vorteil durch nutzung firmenwagen
ple0021 pl Gelenkerkrankungen (auch Arthrose, Rheuma)
pli0094_v2 pl Geselligkeit m. Freund., Verwandt. (kurz) (unregelmaessig) [1985-2017]
ple0005 pl Gesundheitszustand beeintr. Anstreng. Taetigkeiten
ple0004 pl Gesundheitszustand beeintr. Treppen steigen
ple0008 pl Gesundheitszustand gegenwaertig
plh0263_v2 pl Gewerkschaftsmitglied (unregelmaessig) [1990-2015]
plc0051_v2 pl Gewinnbeteiligung Vorjahr Betrag (Euro) [2002-2018]
plh0225 pl Habe lebhafte Phantasie
plb0608 pl Haeufige unterbrechung
plh0185 pl Haeufigkeit aengstlich letzte 4 Wochen
plh0184 pl Haeufigkeit aergerlich letzte 4 Wochen
plj0632 pl Haeufigkeit des Kontakts mit Familie/Freunden im Herkunftsland
plh0186 pl Haeufigkeit gluecklich letzte 4 Wochen
plh0187 pl Haeufigkeit traurig letzte 4 Wochen
plc0001_v2 pl Haushaltsmindesteinkommen netto (Euro) [2002,2007,2012,2017]
plh0206i03 pl Heimzahlen: in eine schwierige Lage bringen
pld0134 pl Heirat
plj0607 pl Herkunftsland: Freie Meinungsaeusserung, Versammlungsrecht und eine unabhaengi
plj0611 pl Herkunftsland: Gleichberechtigung von Maennern und Frauen
plj0608 pl Herkunftsland: Pressefreiheit und Meinungsfreiheit
ple0014 pl Herzkrankheit
plj0550 pl Hilfe: Erlernen der deutschen Sprache
plj0556 pl Hilfe: Finanzielle Situation, Zugang zu staatlichen Leistungen
plj0554 pl Hilfe: Wohnungssuche
pli0051 pl Hobbies, Freizeit Std., Werktg.
plm0554 pl Hoehe Betrag andere finanzielle Unterstuetzungen im letzten Monat
plc0422 pl Hoehe Restschulden aus Krediten
ple0186 pl IGel – individuelle Gesundheitsleistungen, Vorjahr
plb0020_v2 pl In Pflegezeit [2015-2018]
plj0654 pl Integrationskurs des BAMF
plh0007 pl Interesse fuer Politik
plk0038 pl Interviewerfragen – Audiodateien: Haeufigkeit
plk0049 pl Interviewerfragen – Einschaetzung Realitaetsnaehe des Interviews
plk0036 pl Interviewerfragen – uebersetzte Texte: Haeufigkeit
plk0037 pl Interviewerfragen – uebersetzte Texte: Hilfreich
plj0672 pl Jahr Anhoerung
plj0666 pl Jahr Asylantrag
plj0663 pl Jahr BUEMA/Ankunftsnachweis
plh0226 pl Kann mit Stress gut umgehen
plh0217 pl Kann verzeihen
ple0160 pl Kassenwechsel in Vorjahr
plb0159_v3 pl Kein Arbeitsweg,wechselnder Arbeitsort [2000-2013,2015,2017]
p_buh9 pl Keine Uebersetzungshilfe
pld0152 pl Kind geboren
pli0098_v1 pl Kirchgang, Besuch religioeser Veranstaltungen (kurz) (unregelmaessig) [1990-2017
plj0678 pl Klage gegen Entscheidung ueber Asylantrag
ple0007 pl Koerpergewicht in kg
ple0006 pl Koerpergroesse in cm
ple0053 pl Krankenhausaufenthalt Vorjahr
ple0015 pl Krebserkrankung
plb0024_v3 pl Laenger als 6 Wochen krank gemeldet [1999-2018]
plh0206i08 pl Langes Nachdenken bei Unrecht
plh0182 pl Lebenszufriedenheit gegenwaertig
plh0183 pl Lebenszufriedenheit in 5 Jahren
plh0206i07 pl Leichte Verarbeitung emotionaler Verletzung
ple0036 pl Leiden unter chronischen Krankheiten
plj0073 pl Lesekompetenz: deutsch
plc0011 pl Letztes Wort finanzielle Entscheidung
plh0377_v2 pl Locus of Control:Beeinflussung soz. Verh. durch Engagement [2005,2010,2015-2016
plh0381_v2 pl Locus of Control:Erfahr.,dass andere mein Leben bestimmen [2005,2010,2015-2016]
plh0382_v2 pl Locus of Control:Erfolg ist hart erarbeitet [2005,2010,2015-2016]
plh0385_v2 pl Locus of Control:Faehigkeiten wichtiger als Anstrengung [2005,2010,2015-2016]
plh0378_v2 pl Locus of Control:Habe nicht das erreicht,was ich verdiene [2005,2010,2015-2016]
plh0379_v2 pl Locus of Control:Mein Lebenslauf haengt von mir ab [2005,2010,2015-2016]
plh0384_v2 pl Locus of Control:Moeglichk. von soz. Umstaenden bestimmt [2005,2010,2015-2016]
plh0380_v2 pl Locus of Control:Was man erreicht haengt von Glueck ab [2005,2010,2015-2016]
plh0386_v2 pl Locus of Control:Wenig Kontrolle ueber Dinge in m. Leben [2005,2010,2015-2016]
plh0383_v2 pl Locus of Control:Zweifle bei Schwierigkeiten an Faehigkt. [2005,2010,2015-2016]
plh0216 pl Mache mir oft Sorgen
ple0017 pl Migraene
plc0509 pl Mindestlohn Euro/Stunde (Cent)
plc0508 pl Mindestlohn Euro/Stunde (Euro)
plh0264_v2 pl Mitglied im Berufsverband (unregelmaessig) [1990-2015]
plh0265 pl Mitglied in Betriebs-,Personalrat
plh0266 pl Mitglied in Umweltschutzorganisation
plj0118_v3 pl Mutter – Entfernung [2006,2011,2016]
plc0153_v2 pl Mutterschafts-/Elterngeld Brutto letzter Monat (Euro) [2002-2018]
plc0155_v2 pl Mutterschaftsgeld Betrag Vorjahr (Euro) [2002-2018]
plc0154 pl Mutterschaftsgeld Monate Vorjahr
plb0019_v2 pl Mutterschutz/Elternzeit [2001-2018]
plj0009 pl Muttersprache deutsch: beide Eltern
plh0344 pl Nachdenken ueber geld
plb0206_v2 pl Nachtarbeit, nach 22 Uhr (unregelmaessig) [1995-2017]
plh0341 pl Nervositaet
plc0017_v2 pl Netto Lohn als Arbeitnehmer Betrag Vorjahr [2002-2018]
plb0420_v2 pl Nettoverdienst mind. /Monat (Euro) [2002-2018]
ple0027 pl Niedergeschlagen letzten 4 Wochen
pld0067 pl Niemand als Vertrauensperson
pld0088 pl Niemand darf unangenehme Warheit sagen
pld0073 pl Niemand foerdert Vorankommen im Beruf, Ausbildung
pld0082 pl Niemand: belastender Streit, Konflikt
plf0047 pl Niemand: Um Hilfe bitten bei Pflegebeduerftigkeit
pli0165 pl Nutzen sozialer Online-Netzwerke
plh0333 pl Partei Bundestagswahl
plh0204_v2 pl Persoenliche Risikobereitschaft [2004,2006,2008-2018]
plh0206i11 pl Positive Einstellung selbst gegenueber
plc0242 pl Private Altersrente (in EURO)
pli0085_v2 pl Private Internet-Nutzung [2003,2008,2013]
plc0285 pl Private Witwenrente (in EURO)
plh0206i02 pl Rache bei schwerem Unrecht
ple0081_v2 pl Rauchen gegenwaertig (unregelmaessig) [2004-2018]
ple0086_v3 pl Rauchen: Anzahl Pfeifen pro Tag (unregelmaessig) [2002-2018]
ple0086_v2 pl Rauchen: Anzahl Zigaretten pro Tag (unregelmaessig) [2002-2018]
ple0086_v4 pl Rauchen: Anzahl Zigarren pro Tag (unregelmaessig) [2002-2018]
plk0033 pl Record Linkage (IEB)
plj0614 pl Regierungsformen: Demokratisches System
plj0612 pl Regierungsformen: Starker Fuehrer
plh0258_v9 pl Religionszugehoerigkeit [2013,2016-2018]
plh0258_v8 pl Religionszugehoerigkeit [2015]
plc568 pl Rente aus dem Ausland Brutto/Monat 2017
plc0233_v2 pl Rente/Pension Brutto letzter Monat (Euro) [2002-2018]
plc0416 pl Restschuld Immobilie
plf0067 pl Restschuld Wohneigentum
plc0516 pl Riesterrente ae Brutto/Monat Vorjahr
plc0335 pl Rueckkaufwert Vers. o. Geldanlagen
plh0220 pl Schaetze kuenstler. Erfahrung
pld0140 pl Scheidung
ple0011 pl Schlafstoerung
ple0016 pl Schlaganfall
plj0072 pl Schreibkompetenz: deutsch
plb0571 pl Schwarzarbeit im persoenlichen Umfeld Vorjahr
plj0124 pl Schwester, Schwestern – Entfernung
plb0282_v2 pl Seit Anfang Vorjahr aus Beruf ausgeschieden [2001-2018]
plg0072 pl Seit Vorjahr Ausbildung abgeschlossen
plj0123_v3 pl Sohn, Soehne – Entfernung [2006,2011,2016]
ple0023 pl Sonstige Krankheit
plc0053_v2 pl Sonstige Sonderverguetung Brutto Vorjahr (Euro) [2002-2018]
plc0203_v2 pl Sonstige Unterstuetzung ausserhalb HH Brutto letzter Monat (Euro) [2002-2018]
plh0032 pl Sorgen allgemeine wirtschaftliche Entwicklung
plh0042 pl Sorgen Arbeitsplatzsicherheit
plh0335 pl Sorgen eigene Altersversorgung
plh0035 pl Sorgen eigene Gesundheit
plh0033 pl Sorgen eigene wirtschaftliche Situation
plj0597 pl Sorgen Ergebnis des Asylverfahrens
plh0038 pl Sorgen Friedenserhaltung
plh0336 pl Sorgen soz. Zusammenhalt der Ges.
plj0046 pl Sorgen Zuwanderung
plj0598 pl Sorgen, nicht in Deutschland bleiben zu koennen
plb0031_v2 pl Stellenwechsel im Vorjahr [1994-2018]
plj0624 pl Stellung der Frau: Ausbildung des Sohnes wichtiger als die der Tochter
plj0122_v3 pl Tochter, Toechter – Entfernung [2006,2011,2016]
pld0163 pl Tod der Mutter
pld0146 pl Tod des Partners
pld0160 pl Tod des Vaters
pld0166 pl Tod eines Kindes
pld0143 pl Trennung von Partner
plh0206i16 pl Umgang mit schwierigen Situationen
plj0045 pl Umzug nach West-/Ostdeutschland moeglich?
plc0190_v1 pl Unterhalt aus Unterhaltsvorschusskassen Betrag Vorjahr [2010-2017]
plc0184 pl Unterhalt aus Unterhaltsvorschusskassen Bruttobetrag pro Monat
plc0535 pl Unterhalt von frueherem partner/kindesunterhalt brutto letzter monat
plc0528 pl Unterhalt von frueherem partner/kindesunterhalt brutto/monat
plc0527 pl Unterhalt von frueherem partner/kindesunterhalt monate
plc0198_v2 pl Unterstuetzung ausserhalb des HH Betrag Vorjahr (Euro) [2002-2018]
plc0205_v1 pl Unterstuetzung ausserhalb des HH Monate Vorjahr [1995-2018]
plj0438 pl Unterstuetzung Fluechtlinge letztes Jahr: Spenden
plj0439 pl Unterstuetzung Fluechtlinge zukuenftig: Spenden
plc0049_v2 pl Urlaubsgeld Vorjahr Betrag (Euro) [2002-2018]
plj0119_v3 pl Vater – Entfernung [2006,2011,2016]
plj0568 pl Verbrachte Zeit mit Personen des Herkunftslandes
plj0080 pl Verbundenheit Heimatland
plj0043 pl Verbundenheit zum Wohnort
plh0356 pl Verein/Sonst. Organisation
plh0206i10 pl Vergeben und Vergessen von Unrecht
plf0063 pl Verkehrswert Wohneigentum
plb0433_v2 pl Verlust des Arbeitsplatzes (unregelmaessig) [1999-2018]
plc0366 pl Vermoegenswert Betrieb, Beteiligung
plj0604 pl Wahrscheinlichkeit einer Ausbildung oder Weiterbildung in Deutschland
plj0044 pl Wegzug aus familiaeren/berufl.Gruenden?
plc0047_v2 pl Weihnachtsgeld Vorjahr Betrag (Euro) [2002-2018]
p_anw_v2 pl Weitere Personen anwesend [2016-2018]
plh0206i18 pl Weiterentwicklung durch schwierige Situationen
ple0033 pl Weniger geschafft wg. seelischer Probleme
ple0034 pl Weniger Sorgfalt wg. seelischer Probleme
plc0316 pl Wert Bausparvertrag
plc0329 pl Wert der Geldanlagen
plh0107 pl Wichtigkeit: Erfolg im Beruf haben
plh0111 pl Wichtigkeit: Sich politisch, gesellschaftlich einsetzen
ple0177 pl Wie oft Alkohol
ple0180 pl Wie oft Fisch
ple0179 pl Wie oft Fleisch
ple0181 pl Wie oft Gefluegel
plc0274_v2 pl Witwen/Waisenrente Brutto letzter Monat (Euro) [2002-2018]
plc0283_v2 pl Witwenrente betriebliche Altersversorgung (in EURO) [2003-2018]
plc0286_v2 pl Witwenrente Unfallversicherung (EURO) [2003-2018]
plc0281_v2 pl Witwenrente Zusatzversorgung oeffentlicher Dienst (EURO) [2003-2018]
pld0133 pl Wohnt Partner,-in im Haushalt
plb0241_v2 pl Wunscharbeitszeit Std./Wo. [2000-2015,2017-2018]
plb0041 pl Zeitarbeit
plj0024_v1 pl Zeitpunkt Erwerb deutscher Staatsangehoerigkeit [2002-2012,2014-2018]
plh0061 pl Ziel: Schutz freie Meinungsaeusserung
plh0180 pl Zufriedenheit Familienleben
plh0171 pl Zufriedenheit Gesundheit
plh0162 pl Zufriedenheit Lebensstandard
plj0681 pl Zufriedenheit mit Wohnsituation – Allgemein
plj0683 pl Zufriedenheit mit Wohnsituation – Geraeuschpegel
plj0689 pl Zufriedenheit mit Wohnsituation – Moeglichkeit, Deutsch zu lernen
plj0682 pl Zufriedenheit mit Wohnsituation – Qualitaet des Essens
plh0177 pl Zufriedenheit Wohnung
plh0258_v11 pl Zugehoerigkeit islam. Religionsgemeinschaft [2013,2015-2018]
plb0417_v2 pl Zukuenftige Erwerbstaetigkeit beabsichtigt [1994-2018]
pld0137 pl Zusammenzug mit Partner
plc0238_v2 pl Zusatzversorgung Rente Brutto/Monat (Euro) [2003-2018]
plc0056 pl Zuschuesse fuer oeffentlichen Nahverkehr: Betrag (in EURO)
plj0437 pl Zustrom von Fluechtlingen langfristig mehr Risiko oder Chance
plc0543 pl Zweite Nebentaetigkeit Bruttoverdienst letzter Monat
AnzahlFall RKI Daten zu COVID-19-Dashboard COVID-19 Fälle
AnzahlGenesen RKI Daten zu COVID-19-Dashboard COVID-19 Genesene
AnzahlTodesfall RKI Daten zu COVID-19-Dashboard COVID-19 Todesfälle
IdLandkreis RKI Daten zu COVID-19-Dashboard Gemeindekennziffer
Inzidenz RKI Daten zu COVID-19-Dashboard Inzidenz
Meldedatum RKI Daten zu COVID-19-Dashboard Meldedatum
hid zvp Aktuelle Haushaltsnummer (=ZHHNR)
syear zvp Befragungsjahr
Tabelle A.2: Randverteilungen für die Anpassung auf HH-Ebene. Quelle: Statistisches Bundesamt, Mikrozensus 2018, eigene Berechnungen.
Merkmal Ausprägung Haushalte
Bundesland Berlin, Brandenburg 3.285.000
Bundesland Hamburg, Schleswig-Holstein 5.286.000
Bundesland Bremen, Niedersachsen 6.453.000
Bundesland Nordrhein-Westfalen 4.339.000
Bundesland Hessen 2.473.000
Bundesland Saarland, Rheinland-Pfalz 830.000
Bundesland Baden-Württemberg 8.756.000
Bundesland Bavaria 3.091.000
Bundesland Mecklenburg-Vorpommern 2.454.000
Bundesland Sachsen-Anhalt 2.156.000
Bundesland Thüringen 1.151.000
Bundesland Sachsen 1.104.000
HHGröße 1-Personen Haushalt 17.334.000
HHGröße 2-Personen Haushalt 13.983.000
HHGröße 3-Personen Haushalt 3.748.000
HHGröße 4-Personen Haushalt 4.923.000
HHGröße Haushalt mit 5 oder mehr Personen 1.390.000
Gemeindegrößenklasse Weniger als 20,000 Einwohner 7.660.000
Gemeindegrößenklasse 20,000-100,000 Einwohner 11.309.000
Gemeindegrößenklasse 100,000-500,000 Einwohner 15.642.000
Gemeindegrößenklasse Mehr als 500,000 Einwohner 6.767.000
Eigentümer Eigentümer 22.154.796
Eigentümer Mieter 19.223.204
HHTyp Single-Haushalt 17.334.000
HHTyp 2 Erwachsene ohne Kind 13.204.000
HHTyp 2 Erwachsene , 1 oder 2 Kinder 3.790.000
HHTyp Alleinerziehendes Elternteil, weniger als 3 Kinder 1.214.000
HHTyp Alleinerziehendes Elternteil, 3 oder mehr Kinder 4.983.000
HHTyp Familien mit mehr als 3 Kindern 853.000
Letztes Zuzugsjahr 1900-1979 35.410.969
Letztes Zuzugsjahr 1980-1984 851.551
Letztes Zuzugsjahr 1985-1989 1.323.417
Letztes Zuzugsjahr 1990-1994 749.033
Letztes Zuzugsjahr 1995-1999 381.391
Letztes Zuzugsjahr 2000-2004 1.154.279
Letztes Zuzugsjahr 2005-2009 945.699
Letztes Zuzugsjahr 2010-2013 561.661
Nationalität EU Bürger 35.023.584
Nationalität Ehemaliges Jugoslawien 2.699.525
Nationalität GUS Staaten 1.746.731
Nationalität Türkei 632.517
Nationalität Rest der Welt 755.007
Nationalität Nur deutsche Nationalität 520.636
Migrationshintergrund Keine Person mit Migrationshintergrund der 2. Generation im Haushalt 38.074.217
Migrationshintergrund Mindestens eine Person mit Migrationshintergrund der 2. Generation im Haushalt, geboren nach 1995 572.996
Migrationshintergrund Mindestens eine Person mit Migrationshintergrund der 2. Generation im Haushalt, geboren zwischen 1975-1994 353.175
Migrationshintergrund Mindestens eine Person mit Migrationshintergrund der 2. Generation im Haushalt, geboren nach 1995 2.377.612
Tabelle A.3: Randverteilungen für die Anpassung auf Personenebene. Quelle: Statistisches Bundesamt, Mikrozensus 2018, eigene Berechnungen.
Merkmal Ausprägung Personen
Alter x Geschlecht 0-4, männlich 1.880.000
Alter x Geschlecht 0-4, weiblich 1.804.000
Alter x Geschlecht 5-9, männlich 1.825.000
Alter x Geschlecht 5-9, weiblich 1.712.000
Alter x Geschlecht 10-14, männlich 1.860.000
Alter x Geschlecht 10-14, weiblich 1.756.000
Alter x Geschlecht 15-19, männlich 2.093.000
Alter x Geschlecht 15-19, weiblich 1.940.000
Alter x Geschlecht 20-24, männlich 2.311.000
Alter x Geschlecht 20-24, weiblich 2.086.000
Alter x Geschlecht 25-29, männlich 2.650.000
Alter x Geschlecht 25-29, weiblich 2.445.000
Alter x Geschlecht 30-34, männlich 2.705.000
Alter x Geschlecht 30-34, weiblich 2.580.000
Alter x Geschlecht 35-39, männlich 2.652.000
Alter x Geschlecht 35-39, weiblich 2.538.000
Alter x Geschlecht 40-44, männlich 2.457.000
Alter x Geschlecht 40-44, weiblich 2.436.000
Alter x Geschlecht 45-49, männlich 2.851.000
Alter x Geschlecht 45-49, weiblich 2.861.000
Alter x Geschlecht 50-54, männlich 3.480.000
Alter x Geschlecht 50-54, weiblich 3.466.000
Alter x Geschlecht 55-59, männlich 3.257.000
Alter x Geschlecht 55-59, weiblich 3.257.000
Alter x Geschlecht 60-64, männlich 2.651.000
Alter x Geschlecht 60-64, weiblich 2.782.000
Alter x Geschlecht 65-69, männlich 2.341.000
Alter x Geschlecht 65-69, weiblich 2.505.000
Alter x Geschlecht 70+, männlich 5.393.000
Alter x Geschlecht 70+, weiblich 7.039.000
Ausländer nein 71.706.000
Ausländer ja 9.907.000
Zuzugsjahr 1900-1979 71.354.989
Zuzugsjahr 1980-1984 1.306.214
Zuzugsjahr 1985-1989 818.330
Zuzugsjahr 1990-1994 1.262.019
Zuzugsjahr 1995-1999 1.837.921
Zuzugsjahr 2000-2004 1.419.751
Zuzugsjahr 2005-2009 1.134.676
Zuzugsjahr 2010-2013 555.342
Zuzugsjahr Andere 1.923.758
Nationalität EU Bürger 69.872.114
Nationalität Ehemaliges Jugoslawien 4.757.776
Nationalität GUS Staaten 1.281.253
Nationalität Türkei 3.166.757
Nationalität Rest der Welt 1.633.195
Nationalität Nur deutsche Nationalität 901.904
Migrationshintergrund Indirekte Migration, born after 1995 4.622.919
Migrationshintergrund Indirekte Migration, German nat., born 1975/1994 75.720.370
Migrationshintergrund Indirekte Migration, other nat., born 1975/1994 529.641
Migrationshintergrund Indirekte Migration, other nat. born before 1964 until 1974 524.932
Migrationshintergrund Direkte oder keine Migration, oder indirekte Migration, aber Deutsche Nationalität und vor 1975 geboren 215.138
Tabelle A.4: Randverteilungen für die Anpassung für Erwachsene. Quelle: Statistisches Bundesamt, Mikrozensus 2018, eigene Berechnungen.
Merkmal Ausprägung Erwachsene
Ausländer nein 60.902.285
Ausländer ja 8.603.532
Alter x Geschlecht 18-19, männlich 1.048.501
Alter x Geschlecht 18-19, weiblich 1.065.027
Alter x Geschlecht 20-24, männlich 2.381.657
Alter x Geschlecht 20-24, weiblich 2.124.357
Alter x Geschlecht 25-29, männlich 2.705.653
Alter x Geschlecht 25-29, weiblich 2.461.676
Alter x Geschlecht 30-34, männlich 2.741.518
Alter x Geschlecht 30-34, weiblich 2.593.183
Alter x Geschlecht 35-39, männlich 2.669.233
Alter x Geschlecht 35-39, weiblich 2.551.020
Alter x Geschlecht 40-44, männlich 2.481.609
Alter x Geschlecht 40-44, weiblich 2.439.989
Alter x Geschlecht 45-49, männlich 2.859.804
Alter x Geschlecht 45-49, weiblich 2.866.329
Alter x Geschlecht 50-54, männlich 3.510.252
Alter x Geschlecht 50-54, weiblich 3.478.934
Alter x Geschlecht 55-59, männlich 3.264.397
Alter x Geschlecht 55-59, weiblich 3.259.593
Alter x Geschlecht 60-64, männlich 2.654.516
Alter x Geschlecht 60-64, weiblich 2.783.943
Alter x Geschlecht 65-69, männlich 2.344.381
Alter x Geschlecht 65-69, weiblich 2.516.630
Alter x Geschlecht 70+, männlich 5.491.186
Alter x Geschlecht 70+, weiblich 7.212.427

B Abbildungen

Fallzahlenmäßige Verteilung der Geschätzten Wahrscheinlichkeiten für den Verbleib im SOEP-Core nach Tranche.

Abbildung B.1: Fallzahlenmäßige Verteilung der Geschätzten Wahrscheinlichkeiten für den Verbleib im SOEP-Core nach Tranche.

Fallzahlenmäßige Verteilung der geschätzten Wahrscheinlichkeiten für den Einsatz in SOEP-CoV-Ausgangsbrutto, nach Tranche.

Abbildung B.2: Fallzahlenmäßige Verteilung der geschätzten Wahrscheinlichkeiten für den Einsatz in SOEP-CoV-Ausgangsbrutto, nach Tranche.

DE