François Höpflinger

Ausfälle und Verweigerungen bei Befragungen

Einleitung

Nicht-Erreichbarkeit, ungültige Adressen und Verweigerungen erweisen sich bei allgemeinen Bevölkerungsbefragungen als immer schwerwiegenderes Problem. Aufgrund der höheren Mobilität sind mehr Adressen der Einwohnerämter nicht mehr gültig, und die Erreichbarkeit verschiedener Gruppen der Bevölkerung hat sich verschlechtert. Gleichzeitig kann die Bereitschaft, an einer Befragung teilzunehmen, nicht mehr vorausgesetzt werden, und die Verweigerungsraten haben sich in den letzten Jahrzehnten erhöht.

In diesem Beitrag stehen folgende Fragen im Vordergrund:

a) Welche Formen von Ausfälle treten auf, und welches sind die wichtigsten Punkte einer sorgfältigen Ausschöpfungsanalyse?

b) Welche Folgen für die Repräsentativität einer Befragung haben die verschiedenen Formen von Ausfällen bzw. Verweigerungen? Mit welchen Verzerrungen der Aussagekraft von Umfragen durch Ausfällen und Verweigerungen ist zu rechnen, und wie kann mit Ausfällen umgegangen werden?

Durch die Analyse und Diskussion dieser Fragen kann gewährleistet werden, dass grobe Fehlinterpretationen von Befragungsdaten vermieden werden.

1) Zum Konzept der Repräsentativität und der Zufallsauswahl

Eine Befragung kann als "repräsentativ" definiert werden, wenn die Stichprobe in ihrer Verteilung der definierten Grundgesamtheit entspricht. Repräsentativ bedeutet, dass die aus einer Teilbefragung bzw. Stichprobe von Personen gewonnenen Informationen als für die Grundgesamtheit aller Personen gültig angesehen werden können, wodurch beispielsweise aus den Antworten von 1000 Bürger/innen auf die politische Einstellung aller Bürger/innen geschlossen werden kann.

Eine Verallgemeinerung oder auch Hochrechnung von Befragungsdaten - die auf einer Stichprobe von Personen beruhen - auf die Grundgesamtheit ist allerdings nur gültig, wenn die Stichprobe gemäss der statistischen Theorie gebildet wurde. Die wichtigste Regel ist, dass die zu befragenden Personen im statistischen Sinne "zufällig" ausgewählt wurden. Jede Person (oder Befragungseinheit) aus der definierten Grundgesamtheit muss statistisch die genau gleiche Wahrscheinlichkeit haben, in die Befragung einbezogen zu werden. Nur eine Zufallsauswahl lässt einen späteren Induktionsschluss und das Testen von Hypothesen mit Hilfe von Signifikanztests zu. In anderen Worten: Repräsentative Umfragen setzen ein Zufallssample (engl. random sampling) voraus. Verzerrungen bei der Adressenbeschaffung oder Ausfälle - wie Verweigerungen - stellen die Repräsentativität einer Befragung - und damit die Verallgemeinbarkeit der Beobachtungen - in Frage.

Damit eine Befragung als repräsentative Befragung bezeichnet werden kann, sind neben dem Prinzip der Zufallsauswahl noch zwei weitere elementare Voraussetzungen notwendig:

Neben der Zufallsauswahl setzt Repräsentativität auch eine bestimmte Stichprobengrösse voraus. Nur bei genügend grosser Stichprobengrösse können die in einer Befragung gefundenen Daten mit genügender Genauigkeit auf die Grundgesamtheit verallgemeinert werden. Das Gesetz der grossen Zahl besagt, das ein Stichprobenwert umso eher mit dem echten Wert der Grundgesamtheit identisch ist, je mehr sich die Stichprobengrösse der Grösse der Grundgesamtheit nähert. Umgekehrt gilt, dass die aus einer beschränkten Stichprobe gewonnenen Werte mehr oder minder stark von ihrem wahren Wert abweichen müssen (= Stichprobenfehler). Alle aufgrund von Stichproben gewonnenen Ergebnisse können deshalb lediglich wahrscheinlichkeitstheoretische Aussagen sein, deren Genauigkeit vom Stichprobenfehler abhängt. Der Zweck von Signifikanztests liegt im Grunde einzig darin, zu berechnen, mit welcher Wahrscheinlichkeit die zwischen verschiedenen Gruppen von Befragten beobachteten Unterschiede als Unterschiede innerhalb der Grundgesamtheit verallgemeinert werden können.

Der Stichprobenfehler ist mit der Zahl von Befragten assoziiert, und er reduziert sich mit zunehmender Stichprobengrösse. Je genauer die gemachten Aussagen sein sollen, desto mehr Personen müssen befragt werden. Die "Kunst" liegt darin, zwischen finanziellen Grenzen (möglichst wenig Interviews) und statistischer Genauigkeit (möglichst viele Interviews) zu optimieren.

Bei reinen Zufallsstichproben lässt sich der Stichprobenfehler (= wahrscheinliche Abweichung des Stichprobenwertes vom wahren Wert) ohne grosse Probleme errechnen, da der Stichprobenfehler einer Variable nur von zwei Grössen abhängt:

a) von der Variabilität des Merkmals in der Grundgesamtheit, die durch die Stichprobenvarianz geschätzt wird. Je grösser die Streuung (s) eines Merkmales, desto grösser ist der Schätzfehler. Bei einer Streuung von p = 50% (bzw. 50% Ja, 50% Nein) ist der Schätzfehler am höchsten.

b) von der Grösse der Stichprobe. Der Stichprobenfehler verändert sich umgekehrt proportional zur Quadratwurzel der Stichprobegrösse (n). In anderen Worten, um den Stichprobenfehler zu halbieren, muss man einen viermal so grossen Personenkreis befragen. Wegen dieser nichtlinearen Relation zwischen Stichprobengrösse und Stichprobenfehler verzichtet man in der Praxis oft auf eine minimale Fehlerreduktion zugunsten der tieferen Kosten einer kleineren Stichprobengrösse.

Diese einfache Formel gilt allerdings nur bei einer reinen Zufallsauswahl. Bei geschichteten Stichproben reduziert sich der Stichprobenfehler zumindest bei den Merkmalen (wie z.B. Geschlecht, Altersgruppen), die für die Schichtung berücksichtigt wurden (da durch eine Schichtung einer Stichprobe die Zufallsvariationen bei diesen Merkmalen wegfallen). Auch bei disproportional geschichteten Stichproben (z.B. aufgrund einer gezielten Uebervertretung (oversampling) bestimmter Gruppen) gilt die obige Formel nicht. Entsprechende Anpassungen der Formel sind auch bei Kluster-Stichproben und/oder mehrstufigen Auswahlverfahren notwendig (vgl. Kalton 1983).

Eine weitere, oft vernachlässigte Voraussetzung für eine Zufallsauswahl ist eine eindeutig definierte und quantitativ bekannte Grundgesamtheit. In anderen Worten: Repräsentative Befragungen sind im wesentlichen nur dort möglich, wo eine klar abgrenzbare und von vornherein bekannte Grundgesamtheit vorliegt.

Eine Zufallsauswahl aus einer unbekannten oder schlecht abgrenzbaren Grundgesamtheit (z.B. alle Personen, die an Depression leiden; alle Aktivmitglieder eines Vereins) ist nur möglich, wenn vorgängig aus einer umfassenderen Population (z.B. Gesamtbevölkerung) eine Vorabklärung der Prävalenz dieser Subpopulation (Depressive, Aktive) durchgeführt wurde (z.B. via Zufalls-Suchinterviews bei der Gesamtpopulation zur Abklärung, ob eine Person in die Untersuchungsgruppe fällt oder nicht).

Eine Zufallsauswahl - und damit auch die Gewährleistung der Repräsentativität einer Befragung - ist umso leichter zu organisieren, je klarer und eindeutiger die zu untersuchende Population definiert wird. In der sozialwissenschaftlichen Forschung wird dieser Punkt oft vernachlässigt, etwa wenn Befragungen bei unscharf oder unklar abgrenzbaren sozialen Gruppen durchgeführt werden (wie z.B. 'Singles', Alleinerziehende, Arme usw.). Sofern die Häufigkeit dieser Gruppen in der Population gemäss eindeutigen Kriterien nicht vorgängig abgeklärt wurde - z.B. via Suchinterviews - ist eine Zufallsauswahl streng gesehen nicht möglich. In solchen Fällen sind nichtzufällige Auswahlverfahren - z.B. pragmatische Auswahl, 'Schneeballprinzip', usw. - angebrachter.

2) Formen von Ausfällen und ihre Konsequenzen

2.1 Ausfälle aufgrund ungültiger Adressen

Ausfälle bei den Adressen ergeben sich durch Adressfehler bzw. ungültige Telefonnummer, nicht gemeldete Wohnortsänderungen oder noch nicht registrierte Todesfälle. Diese Ausfälle sind umso höher, je langsamer Adressänderungen verarbeitet werden, je unwirksamer die Einwohnerkontrolle funktioniert bzw. je mehr Leute sich nicht um eine korrekte An- und Abmeldung kümmern.

Vielfach werden diese Ausfälle als 'qualitätsneutrale' Ausfälle bezeichnet. Damit wird suggeriert, dass sich dabei keine sozialen Verzerrungen ergeben und dass diese Ausfälle ohne weiteres durch Ersatz-Adressen ersetzt werden können. Dies ist allerdings nur bedingt der Fall.

An und für sich muss bei adressbedingten Ausfällen zwischen zwei Formen unterschieden werden:

a) Ausfälle aufgrund der Tatsache, dass die entsprechende Person nicht oder nicht mehr der definierten Grundgesamtheit angehört (z.B. verstorbene oder aus der Untersuchungsregion weggezogene Personen). Dazu gehören unter Umständen auch Personen, die nicht den von der Untersuchung verlangten Alterskategorien usw. angehören. Diese Ausfälle führen zu keinerlei Verzerrungen und können ohne Probleme durch Ersatzadressen ersetzt werden.

Sofern Einwohneradressen nicht mehr voll aktuell sind, kann die Zahl von Weggezogenen recht hoch sein, vor allem bei regionalen oder lokalen Studien. Ob Personen aus der Untersuchungsregion weggezogen sind - und deshalb nicht mehr zur Untersuchungspopulation gehören - oder ob sie innerhalb der Untersuchungsregion gewandert sind, ist im einzelnen oft schwierig nachprüfbar. Im Fall veralteter Adressen bei hoher interregionaler Wanderung können sich auch insofern (kleine) Verzerrungen der Befragungspopulation ergeben, als Neu-Zuzüger/innen - die neu zur Untersuchungspopulation gehören - nicht berücksichtigt werden.

b) Ausfälle aufgrund falscher oder nicht mehr gültiger Adressangaben von Personen der untersuchten Grundgesamtheit. Hier handelt es sich primär um Personen, die innerhalb der Untersuchungsregion ihren Wohnort gewechselt, aber nicht gemeldet haben (z.B. bei gesamtschweizerischer Befragung: (noch) unangemeldete interne Migration, minus Auswanderung ins Ausland). Da geographische Mobilität lebenszyklisch variiert, ergeben sich durch solche Ausfälle insofern soziale Verzerrungen, als mobile Gruppen tendenziell unterrepräsentiert bleiben. Konkret handelt es sich vielfach um Jugendliche und junge Erwachsene (im Uebergang zur Familiengründung). Bei Beginn einer Lehre oder eines Studiums bleibt etwa der Wohnort der Eltern weiterhin formeller Wohnort, ungeachtet der faktischen Wohnsituation. Junge Frauen ziehen zu ihrem Freund, ohne dies offiziell anzugeben usw. Offene und transitorische Lebensformen junger Erwachsener (nichteheliche Lebensgemeinschaften, Wohngemeinschaften, Alleinleben nach Scheidung usw.) sind deshalb in vielen Fällen eher unterrepräsentiert (verglichen mit stabilen Lebensformen (Ehe). Zunehmend häufiger, vor allem bei gehobenen Bildungsschichten, finden sich auch Muster von 'living apart together' bzw. von Wochenpendler/innen usw. Der faktische Wohnsitz stimmt nur noch zeitweise mit dem legalen Wohnsitz überein, was zumindest die Erreichbarkeit erschwert. Auch bei anderen Situationen - Spitalaufenthalt, Heimaufenthalt - stimmt legaler und faktischer Wohnort nicht überein.

Faktisch sind die beiden erwähnten Formen von Ausfällen deshalb nur bedingt 'qualitätsneutral'. Vor allem bei 'veralteten' Adressen ist die Wahrscheinlichkeit relativ hoch, dass hochmobile Gruppen (junge Erwachsene im Uebergang, marginale Gruppen im Sinne von 'Landstreicher, Obdachlose) unterrepräsentiert bleiben. Besonders betroffen werden durch solche Ausfälle Schätzungen von Migrationsraten jedwelcher Art (Wohnortswechsel, Wohnungswechsel, Uebergang in Heim- und Spital usw.). Dabei besteht die Gefahr einer Unterschätzung sowohl von Zuwanderungsraten als auch von Abwanderungsraten.

Die Stichprobenausfälle aufgrund ungültiger oder falscher Adressen können von den Brutto-Ausgangsadressen abgezählt werden, um die bereinigte Ausgangsstichprobe (Netto-Ausgangsadressen) zu errechnen. Die nachfolgenden Ausfallsraten (Anteil an nicht-erreichter Personen, Verweigerungsraten) können - sofern keine Ersatzadressen benützt werden - sowohl von der Brutto-Ausgangsstichprobe oder der Netto-Ausgangsstichprobe berechnet werden. In der entsprechenden englischsprachigen Literatur wird deshalb unterschieden zwischen:

a) 'completion rate' (number of completed interviews or questionnaires divided by the total sample),

b) 'response rate' (number of completed interviews divided by the effective sample (total sample minus the ineligibles) (vgl. Goyder 1987: 9).

2.2 Ausfälle aufgrund von Nichterreichbarkeit

Was die Ausfallsrate aufgrund von Nichterreichbarkeit betrifft, ist diese Rate einerseits von den gewählten Forschungsstrategien abhängig und andererseits mit sozialen Merkmalen von Befragten assoziiert.

Es ist offensichtlich, dass die Häufigkeit nichterreichbarer Personen von folgenden Aspekten des Untersuchungsdesign bzw. der Befragungsstrategie beeinflusst wird:

a) Kontrolle der Ausgangsadressen auf Gültigkeit. Es ist naheliegend, dass eine gründliche Kontrolle und Bereinigung der Ausgangsadressen spätere Probleme der Nichterreichbarkeit bzw. die Häufigkeit vergeblicher Kontaktversuche reduziert. Faktisch wird eine Adresse oftmals erst nach diversen vergeblichen Kontaktversuchen als 'ungültig' erkannt.

b) Dauer und Zeitraum einer Erhebungs- bzw. Interviewphase: Je länger die Interviewphase, desto höher ist die Wahrscheinlichkeit, dass Befragte erreicht werden. Bei mehrmonatiger Feldarbeit reduziert sich die Zahl von Befragten, die aus Urlaubsgründen, wegen kürzerem Spitalaufenthalt usw. nicht kontaktiert werden können. Die Nachteile einer längeren Erhebungsdauer liegen nicht allein in erhöhten Kosten, sondern möglicherweise auch in kontextspezifischen Veränderungen. So können bestimmte politische Ereignisse die Einstellungen von Befragten beeinflussen, so dass zu Beginn und gegen Ende befragte Personen systematisch anderes Antwortverhalten zeigen. Ebenso können konjunkturelle Einflüsse (Beginn einer Krise, Wiederaufschwung) bei längerer Befragungsdauer zu verstärkten periodenspezifischen Effekten führen. Befragungen, die sich über mehrere Monate hinziehen, können zudem saisonalen Effekten unterliegen, was namentlich bei Konsum- und Freizeitverhalten zu bedeutsamen Periodeneffekten führt.

Sachgemäss erweisen sich Ferienzeiten (Schul- und Betriebsferien) als ungünstige Befragungsperioden. Namentlich in den Sommermonaten sind viele Personen urlaubsbedingt abwesend, und grössere Bevölkerungsumfragen sollten wenn möglichst ausserhalb der Haupturlaubssaison unternommen werden. Der zunehmende Reise- und Urlaubstourismus auch in den übrigen Jahreszeiten hat allerdings generell dazu geführt, dass die Erreichbarkeit namentlich junger mobiler Erwachsener sowie kaufkräftiger Bevölkerungsgruppen (z.B. reiche Rentner/innen) heute generell auf mehr Schwierigkeiten stösst, als vor zwei oder drei Jahrzehnten. Schönwetter- oder Schlechtwetterperioden beeinflussen die Erreichbarkeit ebenfalls, und vor allem bei kurzfristig durchgeführten Telefoninterviews, die auf Quoten-Sample basieren, können sich dabei subtile Verzerrungen ergeben (etwa wenn bei schönem Reisewetter primär wenig mobile, behinderte Rentner/innen Zuhause erreicht werden).

c) Häufigkeit, Form und Zeitpunkt von Kontaktversuchen: Es ist naheliegend, dass die Häufigkeit von Kontaktversuchen die Erreichbarkeit beeinflusst. Allerdings gibt es auch in diesem Fall eine Optimierung zwischen Aufwand und Ertrag zu beachten (und eine genaue Protokollierung der Kontaktversuche erweist sich dafür als sinnvoll). Zunehmend häufig sind heute (schon aus Kostengründen) telefonische Vorkontakte. Die Beschränkung auf telefonische Kontaktversuche hat allerdings den Nachteil, dass einige Gruppen (z.B. ärmere Personen ohne eigenes Telefon oder Personen, die keinen eigenen Telefonanschluss haben (Ehefrauen) von vornherein ausgeschlossen werden. Der Zeitpunkt von Kontaktversuchen (auch abends oder am Wochenende) ist ebenfalls relevant, ansonsten Personen mit speziellen Arbeitsbedingungen (Schichtarbeit, Wochenendaufenthalter usw.) unberücksichtigt werden.

Erreichbarkeit bzw. Nichterreichbarkeit (an einem gültigen Wohnort) ist mit verschiedenen sozialen Merkmalen assoziiert. Zuhause leicht erreichbar, namentlich unter Tag sind etwa Hausfrauen oder andere nichterwerbstätige Personen (Betagte), aber auch Heimarbeiter/innen sowie Personen, die krankheitsbedingt Zuhause bleiben usw. Speziell bei Umfragen auf der Basis von Quotensamples sind Hausfrauen häufig überrepräsentiert, vor allem im Vergleich zu vollerwerbstätigen Frauen. Schwieriger zu erreichen sind vor allem mobile Gruppen (sei es aufgrund ihrer beruflichen Mobilität (z.B. Handelsreisende, Pendler); sei es aufgrund ihrer ausserberuflichen Mobilität (z.B. reise- und urlaubsfreudige junge Erwachsene oder Rentner/innen). Abwesenheit ist im allgemeinen speziell bei jüngeren, unverheirateten Personen vergleichsweise häufig, und sie nimmt nach einer Familiengründung bzw. Geburt von Kindern eher ab. Deutliche Ausfallsraten aufgrund Abwesenheit sind deshalb primär in jüngeren Altersgruppen zu verzeichnen.

Daneben gibt es spezifische Bevölkerungsgruppen, die aus institutionellen Gründen nicht erreichbar sind, zumindest nicht für ein Interview. Dazu gehören Gefängnisinsassen (meist jüngere Männer) oder Personen, die sich längerfristig in Spitälern, Anstalten oder Heimen aufhalten. Selbst bei vorhandener Kommunikationsfähigkeit sind Personen in institutionellen Haushaltungen im allgemeinen schlecht erreichbar, was dazu führt, dass sich die meisten Umfragen explizit oder implizit auf Personen in Privathaushalten beschränken. Auch in manchen gerontologischen Studien wird die Stichprobe oft auf 'Zuhause lebenden Betagte' limitiert. Dies führt mit steigendem Alter zu einer zunehmend stärkeren Selektivität der untersuchten Population (z.B. in Hinblick auf Gesundheitszustand, Selbständigkeit, soziale Ressourcen usw.).

Ganz allgemein führt Nichterreichbarkeit zu zwei sozialen Verzerrungen: Zum einen ergibt sich ein Bias in Richtung 'Häuslichkeit', in dem relativ häuslich ausgerichtete Personengruppen leichter erreichbar sind als mobile Gruppen. Dadurch werden namentlich berufliche und freizeitbezogene Mobilität und die Häufigkeit ausserhäuslicher Aktivitäten tendenziell unterschätzt. Zum anderen beschränken sich viele Befragungen explizit oder implizit auf Personen in Privathaushaltungen. Institutionelle Haushaltungen bleiben unberücksichtigt. Dies führt zu Bias namentlich bei Hochbetagten, aber auch bei der Untersuchung marginaler Subgruppen.

2.3 Ausfälle wegen Kommunikationsproblemen (Nicht-Befragbarkeit)

Nicht-Erreichbarkeit und Nicht-Befragbarkeit werden häufig nicht gesondert ausgewiesen. Es handelt sich jedoch um zwei grundsätzlich andere Ausfälle, die in weiten Teilen einer unterschiedlichen sozialen Verteilung unterliegen.

Ausfälle wegen Kommunikationsproblemen können sich namentlich aus den folgenden Gründen ergeben:

a) Sprachprobleme: Ein in der Landessprache durchgeführtes Interview kann nicht durchgeführt werden, sofern die Person der entsprechenden Sprache nicht mächtig ist. Dies betrifft einerseits ausländische Personen sowie andererseits Personen, die einer Sprachminderheit angehören (z.B. Rätoromanen). Mit zunehmender multikultureller Ausrichtung einer Gesellschaft verstärken sich solche Probleme (und entsprechende Uebersetzungen des Fragebogens bzw. Mitarbeit von Uebersetzern stossen auf finanzielle Grenzen). In der Schweiz ergeben sich auch bei einigen ländlichen Bevölkerungsgruppen einige Kommunikationsprobleme, als der Fragebogen nicht dem ortsüblichen Dialekt entspricht. Dies wirkt sich vor allem bei telefonischen und schriftlichen Befragungen nachteilig aus. Bei schriftlichen Befragungen kommt hinzu, dass ein nicht unbeträchtlicher Teil der erwachsenen Bevölkerung mehr oder weniger lese- und schreibunkundig sind. Speziell bei schriftlichen Befragungen ergeben sich deshalb meist namhafte bildungsbezogene Verzerrungen.

b) Hör- und Sehbehinderungen: Hör- und Sehbehinderungen können ebenfalls zu Ausfällen - sowie zu missverstandenen Antworten - führen. Da Hör- und Sehbehinderungen mit steigendem Lebensalter häufiger werden, ergeben sich diesbezügliche Kommunikationsprobleme namentlich bei gerontologischen Studien.

Bei der Befragung von betagten Personen sollte deshalb schon beim Aufbau des Fragebogens auf mögliche Kommunikationsprobleme geachtet werden. Dies schliesst zum einen gut lesbare Schriftgrösse (bei schriftlichen Interviews oder bei Antwortblättern und Karten mit Antwortvorgaben) ein. Zum anderen sollte bei mündlichen oder telefonischen Interviews auf eine gute Artikulation geachtet werden, und Fragen sollten nicht zu rasch vorgelesen werden. Dies schliesst eine entsprechende Schulung der Interviewer ein. Generell sollten Fragen zudem so kurz sein, dass sie das Kurzzeitgedächtnis nicht überfordern. Dies gilt vor allem für mündliche und telefonische Befragungen. Die allgemeine Regel, Fragen möglichst kurz und unkompliziert zu gestalten, impliziert auch, dass auf komplexe Formulierungen oder doppelte Negation verzichtet wird. In vielen Fällen scheint es besser zu sein, auf interne Antwortvorgaben zu verzichten, sondern auf externe Antwortvorgaben (etwa via Antwortkarten) zurückzugreifen.

William Foddy (1993: 99) schlägt generell vor, komplexere Fragen sowohl mündlich als auch schriftlich zu präsentieren, d.h. den Befragten die Möglichkeit zu geben, die entsprechende Frage nicht nur zu hören, sondern auch zu lesen. Dies gibt gerade auch älteren Menschen mit Hör- oder Sehproblemen eine bessere Chance, die Fragen zu verstehen (und die Interviewsituation zu bestehen, ohne dass indirekt ihre funktionalen Einbussen offen gelegt werden). Nach William Foddy (1993: 99) erweist es sich generell als vorteilhaft, den Befragten eine Kopie des Fragebogens zu übergeben: "The author has found that this procedure has the added benefit of making respondents more comfortable (perhaps because it gives them something to do). It also eliminates the need for 'show' cards etc. While traditionalists might object to this procedure on the grounds that some respondents are likely to skip ahead and think about questions before the interviewer gets to them, the author has never found this to be a problem." (Foddy, 1993: 99).

c) Kommunikationsunfähigkeit wegen Krankheit: Dazu gehören nicht nur Kranke, die aus ethischen Gründen nicht einem Interview zu unterwerfen sind, sondern auch Personen, die nicht ansprechbar sind. Dazu gehören namentlich stark depressive Personen sowie Personen mit Hirnleistungsstörungen (Alzheimer-Patienten). Sachgemäss nimmt der Anteil der Personen, die krankheitsbedingt nicht befragbar sind, in den höheren Altersgruppen deutlich zu.

Nicht-Befragbarkeit - aufgrund von Sprachproblemen oder Kommunikationsunfähigkeit - betrifft einerseits vor allem kürzlich eingewanderte Ausländer/innen aus fremden Kulturen, aber auch Angehörige kultureller Minderheiten (mit eigenem Dialekt). Zum anderen betrifft es Kranke und Behinderte, was primär bei der Befragung älterer Bevölkerungsgruppen zu namhaften Ausfällen führen kann. Aufgrund solcher Probleme nimmt gerade bei schriftlichen Befragungen die Rücklaufquote (und teilweise auch die Antwortqualität) mit dem Alter tendenziell ab (vgl. Kaldenberg/Koenig/Becker 1994).

Insgesamt wird dank solchen Ausfällen die kulturelle und physisch-psychische 'Normalität' einer Bevölkerung überbetont (und kommunikative Probleme tendenziell unterschätzt). Aufgrund solcher Ausfälle geben Befragungsstudien häufig eine verbesserte Realität (a slightly improved version of reality) wieder (vgl. Lindström 1983: 81, Schnell 1991).

Eine Lösung, um dennoch Informationen etwa über hör-, sehbehinderte oder demente Personen zu erhalten, liegt in der Durchführung von Proxi-Interviews (Befragung von Angehörigen oder von Betreuungspersonen). Sachgemäss können damit höchstens sozio-demographische und ausgewählte biographische Hintergrundsvariablen einer Person erfasst werden.

Sowohl Probleme der Nicht-Erreichbarkeit als auch Probleme der Nicht-Befragbarkeit lassen sich im übrigen durch eine vorgängige Spezifikation der zu untersuchenden Grundgesamtheit reduzieren, z.B. indem explizit nur Personen in Privathaushalten, nur Bürger/innen befragt werden oder eine obere Altersgrenze (nur Personen bis 75 J.) gezogen wird. Dadurch reduzieren sich die entsprechenden Ausfallquoten, allerdings sind die Einschränkungen der Studie bei der Interpretation der Ergebnisse zu beachten. So ergeben Studien, die sich ausschliesslich auf zu Hause lebende Betagte beziehen, ein sozial selektives Bild zur Situation von Betagten.

2.4 Ausfälle aufgrund von Verweigerungen

Die bisher diskutierten Ausfälle implizieren keine gezielte Entscheidung der zu befragenden Personen. Dies hat zur Folge, dass solche Ausfälle zumindest nicht direkt mit Einstellungen assoziiert sind. Dies ist bei Ausfällen aufgrund einer Verweigerung nicht der Fall, namentlich nicht bei Forschungsfragen, die mit der Teilnahme an bzw. Verweigerung einer Befragung assoziiert sind. Im Unterschied zur Nichterreichbarkeit ist die Verweigerung der Befragung eine unmittelbare Reaktion des Befragten vor Beginn des "Messvorgangs". Dabei wirken eine Anzahl von Faktoren mit, die auch beim Interviewvorgang von Bedeutung sind (Motivation zur Teilnahme, Probleme der Rollenfindung, Misstrauen gegenüber Fremden usw.).

Da ein Interview auf Freiwilligkeit beruht, ist in allen Studien mit einer geringeren oder grösseren Zahl von Verweigerungen zu rechnen, wobei die angegebenen Gründe (z.B. Zeitmangel) nicht mit den effektiven Motiven, eine Befragung zu verweigern, übereinstimmen. Ausfälle durch Verweigerung gehören zu den üblichen Feldproblemen der Interviewforschung, wobei die Verweigerungsraten bei allgemeinen Bevölkerungsumfragen seit den 50er Jahren insgesamt angestiegen sind (vgl. Steeh 1981). Eine ganze Reihe von Studien deutet darauf hin, dass die Antwortquoten (response rates) bei mündlichen und telefonischen Befragungen in den letzten Jahrzehnten in diversen Ländern gesunken sind (vgl. Goyder 1987 (USA, Kanada); Betlehem, Kersten 1981 (Niederlanden). Eine neuere Meta-Analyse von 45 Methodenstudien bestätigt den Trend zu sinkenden Antwortquoten in der Zeitperiode 1947 bis 1992 für mündliche und telefonische Befragungen (vgl. Hox, De Leeuw 1994: 338).

Dafür scheinen zum einen strukturelle Wandlungen (wie zunehmende Urbanisierung) verantwortlich zu sein. Zum anderen führen sozio-kulturelle Wandlungen - in Richtung einer Individualisierung und Pluralisierung von Verhaltensmuster - dazu, dass die Teilnahme an vorgegebenen Rollen (wie Befragter) nicht mehr als selbstverständlich vorausgesetzt werden kann. Skepsis gegenüber Wissenschaft, aber auch temporäre Effekte - wie Verunsicherung und Anomie während Krisen- und Umbruchzeiten - können die Teilnahme an Befragungen ebenso negativ beeinflussen, wie etwa die Teilnahme an Abstimmungen und Wahlen. Dabei ist anzunehmen, dass die sinkende politische Partizipation (geringere Teilnahme an Abstimmungen) und die geringere Bereitschaft zu Interviews von ähnlichen Faktoren beeinflusst werden. Gleichzeitig ist - wie früher erwähnt - aufgrund höherer Mobilität mit verstärkten Probleme der Nichterreichbarkeit zu rechnen.

Substantielle Ausfälle aufgrund von Verweigerungen sind heute deshalb in den Sozialwissenschaften keine Ausnahme, sondern die Norm. Damit stellt sich grundsätzlich auch die Frage, welche Befragungen heute tatsächlich noch das Prädikat 'repräsentativ' verdienen.

3 Verweigerungen: Raten, Strategien und mögliche Effekte

Im folgenden sollen kurz drei Aspekte diskutiert und analysiert werden: a) die Berechnung von Verweigerungsraten, b) mögliche Strategien zur Reduktion von Verweigerungsraten, und c) mögliche Effekte von Verweigerungen auf die Aussagekraft von Umfragen.

3.1 Zur Berechnung der Verweigerungsraten

Am saubersten ist die Berechnung der Verweigerungen als Prozentsatz der Ausgangsadressen (Brutto-Verweigerungsrate und/oder als Prozentsatz der bereinigten Ausgangsadressen (Netto-Verweigerungsrate). Dies ist jedoch nur möglich, wenn klar zwischen nicht-erreichten Adressen, nicht-befragbaren Personen und verweigerten Interviews unterschieden werden kann. Zudem lassen sich Verweigerungsraten im obigen Sinn nur errechnen, wenn Ausfälle aufgrund von Nichterreichbarkeit oder Nicht-Befragbarkeit nicht durch andere Adressen ersetzt wurden. Nach Benützun von Ersatzadressen lässt sich hingegen nur das Verhältnis von angefragten Personen und realisierten Interviews errechnen (Realisierungsquote), da die ursprüngliche Zufallsstichprobe (Ausgangsadressen) verändert wurde. Dabei ist zu beachten, dass das Verhältnis von angefragten Personen und realisierten Interviews nicht nur von der Häufigkeit von Verweigerungen bestimmt wird, sondern auch davon beeinflusst ist, in welchem Masse Ersatzadressen zur Verfügung standen bzw. benützt wurden (z.B. um eine vorher festgelegte Mindestzahl von Interviews zu erreichen).

Auch bei schriftlichen Befragungen sind Verweigerungsraten nicht zu berechnen (da nicht zwischen Falsch-Adressen, Nicht-Erreichbarkeit, Nicht-Befragbarkeit und Verweigerungen unterschieden werden kann). Bei schriftlichen Befragungen kann nur die sogenannte 'Rücklaufquote' berechnet werden (als Verhältnis zwischen versandten und ausgefüllt zurückgeschickten Fragebogen). Im übrigen gilt, dass auch beim Quoten-Sample - das streng genommen keine Zufallsauswahl einschliesst - keine Ausfall- oder Verweigerungsraten berechnet werden können (da keine Ausgangsadressen vorliegen). Es können allenfalls Zahl vergeblicher Kontakte bzw. verweigerter Interviews mit der Zahl realisierter Interviews verglichen werden.

3.2. Strategien zur Reduktion von Verweigerungen

Die Strategien zur Verringerung der Verweigerungen bzw. zur Erhöhung der Interviewbereitschaft sind je nach Form einer Befragung unterschiedlich.

Bei schriftlichen Befragungen variiert die Rücklaufquote enorm. Je nach Befragung kann sie 10% bis 70% erreichen. Bei allgemeinen Bevölkerungsbefragungen via schriftlichem Fragebogen sind Rücklaufquoten von über 50% als Erfolg zu verzeichnen. Höhere Rücklaufquoten ergeben sich nur bei spezifischen Befragungsgruppen, die gewohnt sind, Formulare zuverlässig auszufüllen (wie z.B. Beamte, Professionelle usw.). So ergab sich bei einer schriftlichen Befragung von Gemeindeschreiber eine Rücklaufquote von über 75%. Schriftliche Befragungen sind deshalb - als allgemeine Regel - umso erfolgreicher, je gezielter und professioneller die angefragte Zielgruppe ist.

Daneben sind Faktoren wie Aufbau, Layout und Länge eines Fragebogens bedeutsam. Gut lesbare, einfach und klar aufgebaute Fragebögen, die nicht zu lang erscheinen, haben eine höhere Rücklaufquote. Ein portofreies Rückantwortcouvert erhöht die Chance einer Rückantwort ebenfalls. Mahnbriefe oder ein Zweitversand des Fragebogens - bei Personen, die noch nicht geantwortet haben - können die Rücklaufquote gleichfalls erhöhen. Inwiefern monetäre Anreize (Teilnahme an einem Wettbewerb, Gutschein) vertretbar sind, ist umstritten, aber es scheint, dass die Beilage einer kleinen Entschädigung oder eines Gutscheins die Antwortbereitschaft stärkt.

Die Meta-Analyse von Hox, De Leeuw (1994) weist darauf hin, dass die Rücklaufquote schriftlicher Befragungen im Zeitvergleich (1947-1992) eher angestiegen sind. Dafür lassen sich zwei Hauptfaktoren anführen: Zum einen hat sich das Ausbildungsniveau der Bevölkerung eher erhöht, und zum anderen ist die Durchführung schriftlicher Befragungen professioneller geworden.

Bei telefonischen Interviews ist die Schulung der Interviewer in bezug auf Kontaktnahme ein entscheidender Faktor. Eine freundliche Stimme oder eine ansprechende Argumentation sind - wie bei anderen 'Verkaufsgesprächen' - wichtige Elemente. Daneben spielt auch der Zeitpunkt eine bedeutsame Rolle, und die Antwortbereitschaft sinkt während Essenszeiten, während populären Fernsehsendungen oder wichtigen Sportübertragungen. Insgesamt gesehen ist die Antwortbereitschaft bei (professionell durchgeführten) Telefoninterviews ebenso hoch wie bei mündlicher Befragung (vgl. Farago, Zeugin 1993: 448ff.). In einigen Fällen (z.B. bei relativ heiklen Themen) oder bei spezifischen Gruppen (z.B. Personen, die Mühe haben, jemand zu treffen oder in ihre Wohnung zu lassen) ist die Antwortbereitschaft bei Telefoninterviews sogar leicht höher als bei mündlicher Befragung (auch weil kein 'face-to-face'-Kontakt notwendig ist).

Im allgemeinen ist die Verweigerungsquote bei mündlichen Interviews - aufgrund des persönlichen Kontakts und des "Zwangs zur Interaktion" häufig deutlich geringer als bei schriftlichen Befragungen. Allerdings stellen sich bei mündlichen Interviews eher Probleme der Erreichbarkeit. Dennoch sind Antwortquoten bei mündlichen Befragungen vielfach höher als bei schriftlichen Befragungen, vor allem bei breit angelegten Stichproben.

Die Interviewbereitschaft bzw. Verweigerungsrate bei mündlichen Befragungen ist durch eine Vielzahl oft spezifischer Faktoren bestimmt, so dass allgemeine Regeln zur Verminderung der Verweigerung einer mündlichen Befragung nur schlecht vermittelt werden können. Dies ist umso mehr der Fall, als die Interviewbereitschaft teilweise von kontextspezifischen Faktoren beeinflusst sind, auf die Forscher/innen wenig Einfluss nehmen können. So sind wirtschaftliche Krisenzeiten mit starker Verunsicherung weiter Bevölkerungskreise für Befragungen weniger günstig als Phasen allgemeinen Wohlbefindens. Wissenschaftskritische Auseinandersetzungen können die Bereitschaft zum Interview unter Umständen ebenfalls reduzieren, ebenso wie ein genereller Autoritätsverlust von Institutionen die Stellung der Wissenschaft (und damit wissenschaftlicher Studien) beeinträchtigen kann. Dennoch zeigt sich, dass wissenschaftliche Institute im allgemeinen auf eine höhere Antwortbereitschaft stossen als Marketingorganisationen. Zudem stossen Forschungsthemen, die von den Befragten als wichtig angesehen werden, auf eine höhere Antwortbereitschaft (sofern das Thema nicht als zu eng mit dem Intimbereich assoziiert wird) (vgl. Hox, De Leeuw 1994: 337).

Trotz des Einflusses kontextueller und periodenspezifischer Faktoren können erfahrungsgemäss einige organisatorische Faktoren aufgeführt werden, die bei mündlichen Befragungen zur Reduktion der Verweigerungsquoten führen:

So ist die Erfahrung eines Interviewers ein bedeutsamer Faktor, und erfahrene Interviewer weisen deutlich weniger Verweigerungen auf. Es empfiehlt sich daher, grössere Umfragen nicht durch unerfahrene Student/innen durchzuführen. Eine gute Schulung und Begleitung des Interviewer-Stabes kann nicht nur die Interviewqualität erhöhen, sondern sie erlaubt es auch frühzeitig, spezifischen Problemsituationen zu begegnen (wodurch die Verweigerungsquote reduziert wird).

Interviewverweigerungen - oft durch Zeitmangel oder 'kein Interesse' rationalisiert - lassen sich zudem durch eine flexible Gestaltung des Interviewzeitpunktes oder -ortes (leicht) reduzieren. Eine freie Wahl des Zeitpunktes erhöht die Bereitschaft vor allem vielbeschäftigter Personen. Die Möglichkeit, ein Interview ausserhalb der Privatwohnung durchzuführen (z.B. in einem Restaurant), ist angebracht für Gruppen, die Mühe haben, fremde Personen in ihre Privatwohnung zu lassen (z.B. ältere, alleinlebende Frauen und Männer).

Inwiefern eine Voranmeldung und Vorankündigung die Interviewbereitschaft erhöht, ist hingegen weniger klar. Der 'Zwang zur Interaktion' kann bei unangekündigtem Erscheinen grösser sein, wogegen ein Ankündigungsbrief Personen die Möglichkeit öffnet, ein Nein zu formulieren. Eine Vorankündigung (schriftlich oder telefonisch) ist allerdings aus forschungsethischen Gründen angebracht. Unangekündigt erscheinende Interviewer/innen sollten zumindest einen offiziellen Ausweis tragen.

Die Wirkung eines unterstützenden Ankündigungsbriefs ist ebenfalls umstritten. Eine prestigereiche Unterschrift (Hochschulprofessoren, Regierungsmitglieder) kann einerseits die Bedeutung der Studie hervorheben, andererseits zu Abwehrreaktionen führen (vor allem bei oppositionellen Gruppen oder bei generellem Autoritätsverlust des 'Establishments'). Ein pointiertes Einführungsschreiben oder eine öffentliche Kampagne vor Beginn der Interviewphase kann ähnliche 'Backlash'-Effekte auslösen und unter Umständen eine verstärkte Selektion von Antwortenden und Verweigerern zur Folge haben. Eine neutrales Ankündigungsschreiben hingegen hat kaum negative, aber auch wenig positive Konsequenzen, zumindest für die Antwortbereitschaft. Eine telefonische Voranmeldung scheint besser zu sein, da auf Gegenargumente (namentlich: keine Zeit) gezielt Rücksicht genommen werden kann.

3.3 Auswirkungen von Verweigerungen auf die Aussagekraft von Umfragen

Auch bei der Verweigerung - wie bei der Nichterreichbarkeit - ist die Hauptfrage, ob sie ein mehr zufälliges Ereignis darstellt, das mit dem Inhalt der Befragung nicht korreliert, oder ob bestimmte Gruppen in feststellbarem Ausmass eher verweigern als andere Gruppen, wodurch die Repräsentativität der Befragung in Frage gestellt wird. Bei Praktikern der Umfrageforschung besteht die Tendenz, Verweigerung - wie Nichterreichbarkeit - als zufällige Ereignisse zu betrachten. Allerdings gibt es viele Studien, die zeigen dass Interviewverweigerung gerade nicht zufällig geschieht, und dass Verweigerungen zu Verzerrungen der Aussagen bzw. zu Einschränkungen der Repräsentativität führen können.

Die erste Frage ist, ob es eine Kerngruppe ('Hardcore) von Personen gibt, die Interviews prinzipiell und unabhängig von Thema oder Kontaktart ablehnen. Diese Frage ist nicht eindeutig zu beantworten, aber soweit ersichtlich gibt es kaum klare empirische Belege dafür, dass eine konstante Gruppe von Verweigerer existiert (vgl. Schnell, Hill, Esser, 1989: 287). Durchgehend schwierig für standardisierte Interviews zu gewinnen sind einzig 'Eliteangehörige' (oberste Kader, Regierungsmitglieder usw.). Diese Gruppe ist jedoch zahlenmässig relativ gering.

Selbst wenn der 'Hardcore' von Verweigern (momentan noch) gering ist, schliesst dies systematische und signifikante Beziehungen zwischen Interviewverweigerung und sozialen Merkmalen keineswegs aus. Einerseits hängt die Kooperationsbereitschaft zum Interview davon ab, inwieweit die Rolle des Informanden auch im Alltag eingeübt ist und allgemein Kontakte zu Fremden nicht ungewöhnlich sind. Andererseits spielen soziale Integration und soziale Teilnahme eine Rolle. Es fallen in erster Linie solche Bevölkerungsgruppen durch überdurchschnittliche Verweigerungsquoten auf, deren Beziehung zu ihrer sozialen Umwelt mehr oder weniger eindeutig mit "Disengagement" umschrieben werden kann. Bei den Verweigerer sind durchweg Personen mit niedrigem sozio-ökonomischem Status und geringer Schulbildung, Personen mit geringem sozialem oder politischem Engagement sowie Personen mit "Randpersönlichkeiten" übervertreten. Interviewverweigerung kann soziologisch als Ausdruck einer geringen Intensität der sozialen Verflechtung mit der dominanten Kultur im Alltag interpretiert werden. In Bevölkerungsbefragungen sind damit in der Regel Personen umso weniger vertreten, je deutlicher sie von der vorherrschenden Mittelschichtkultur abweichen, und die meisten Befragungen weisen deshalb einen klaren "Mittelschicht-Bias" auf. Dieser Mittelschicht-Bias ist bei Quotensampling - aufgrund des Auswahlprozesses - und bei schriftlichen Befragungen - aufgrund der erforderlich hohen schriftlichen Kommunikationsfähigkeit - ausgeprägter als bei mündlich durchgeführten Interviews gemäss Randomverfahren.

Durch Ausfälle (namentlich Nicht-Erreichbarkeit und Verweigerungen) kann die Verteilung von Merkmalen in bedeutsamer Weise verzerrt werden. Die Frage, ob zudem auch die Beziehungen zwischen Variablen verzerrt werden, ist nicht eindeutig beantwortbar (sofern die Ausfälle nicht zu einer starken Homogenisierung der befragten Bevölkerung führt). Es ist aber generell zu befürchten, dass tendenziell solche Personen befragt werden können, die:

a) den Verhaltensanforderungen eines Interviews (als komplexer und geregelter sprachlicher Interaktionsvorgang) am ehesten entsprechen.

b) von ihren Eigenschaftskonstellationen die von Sozialforschern - des gleichen sozio-kulturellen Kontextes - formulierten Hypothesen stärker stützen als andere Populationsteile.

Dies hat zwei Konsequenzen: Eine Befragung wird erstens aufgrund der Verweigerungen als unproblematischer erfahren als sie tatsächlich ist. Zweitens ergibt sich aufgrund der Resultate eine Standardisierung und Normalisierung von Ergebnissen, wodurch standardisierte Befragungen das Bild einer (gutbürgerlichen) Gesellschaft eher stärken.

Diese 'Normalisierungstendenz' wird im übrigen durch standardisierte Kategorisierungen und Auswertungen noch verstärkt (da spezielle, seltene Konstellationen bei der Auswertung meist zusammengefasst werden). Es ist in diesem Rahmen auch darauf hinzuweisen, dass grössere Bevölkerungsbefragungen soziale und politische Ungleichheiten auch deshalb abschwächen, weil Befragte ungeachtet ihres wirtschaftlichen, sozialen und politischen Einflusses gleichgewichtet werden. Befragungen verstärken damit demokratische Gesellschaftsstereotype, die von den bestehenden sozialen Machtungleichgewichten absehen.

3.4 Zum Umgang mit Ausfällen und Verweigerungen

Selbst bei sorgfältigster Planung und Durchführung einer Befragung lassen sich Ausfälle und Verweigerungen kaum vermeiden, und wie erwähnt ist unter heutigen gesellschaftlichen Bedingungen meist mit recht substantiellen Ausfällen und Interviewverweigerungen zu rechnen. Umso bedeutsamer sind möglichst frühzeitige Ueberlegungen, zum späteren Umgang mit Ausfällen und Verweigerungen. In diesem Zusammenhang existieren diverse, mehr oder weniger sinnvolle Strategien, die im folgenden kurz aufgeführt werden:

a) Redefinition der Untersuchungspopulation: Nach Abschluss der Feldarbeit (und entsprechender Kontrolle von Ausschöpfungsraten für verschiedene Gruppen oder Regionen kann die Grundgesamtheit bzw. Untersuchungspopulation redefiniert werden. Beispielsweise wird bei einer Befragung der Wohnbevölkerung festgestellt, dass Personen in Kollektivhaushaltungen krass untervertreten sind (z.B. wegen Nichterreichbarkeit). Durch eine Einschränkung der Untersuchungspopulation (Personen in privaten Haushaltungen) kann die Repräsentativität erhöht werden (allerdings eben mit der Einschränkung, dass die Aussagen nur für Personen in privaten Haushaltungen gelten). Oder wenn festgestellt wird, dass fremdsprachige Personen krass untervertreten sind, kann es angebracht sein, die Auswertung nur auf Personen zu begrenzen, die die einheimische Sprache beherrschen. Auch bei ausgeprägten regionalen Differenzen der Ausschöpfung kann eine nachträgliche Limitierung der Untersuchungspopulation sinnvoll sein. Die Nachteil sind Informationsverluste bzw. unnütze Ausgaben für unausgewertete Interviews, die unter Umständen durch eine frühzeitige Limitierung der Befragung vermeidbar gewesen wären. Eine nachträgliche Redefinition bzw. Einschränkung der Grundgesamtheit ist zudem nur möglich, wenn klar abgrenzbare Populationsteile ausgeschlossen werden, die nur einen vergleichsweise geringen Anteil der Interviews ausmachen.

b) Verwendung von Ersatzadressen: Heute werden Ausfälle und zum Teil Verweigerungen häufig durch neue Interviewadressen ersetzt. Dementsprechend werden in den meisten Befragungen, die auf Adressen beruhen, schon von vornherein mehr Adressen 'gezogen'. Heute hat es sich eingebürgert, gut 40% bis 60% Ersatzadressen zu ziehen (auch um eine nachträgliche Belästigung von Einwohnerämter zu vermeiden). Das explizite Ziel von Ersatzadressen liegt meist darin, eine bestimmte (vertraglich vereinbarte) Stichprobenzahl zu erreichen.

Damit wird zwar dem Gesetz der grossen Zahl Rechnung getragen, indem auch bei hohen Ausfall- und Verweigerungsraten die gewünschte Stichprobengrösse erreicht wird. Die Stichprobengrösse ist jedoch nur eine Voraussetzung für induktive Schlüsse. Teilweise besteht insofern Verwirrung, als eine grosse Stichprobenzahl an sich als genügende Voraussetzung für Repräsentativität angenommen wird. Es wird oft einzig auf die statistische Signifikanz geachtet, und je mehr 'signifikante Beziehungen' gefunden werden, desto besser. Es ist klar, dass signifikante Beziehungen bzw. Gruppendifferenzen umso häufiger auftreten, je grösser die Stichprobe ist, und bei genügend vielen Fällen ist faktisch alles signifikant. Die statistische Signifikanz wird nicht selten mit dem (parametrischen oder nicht-parametrischen) Erklärungsgrad (erklärte Varianz) vermischt. Bei grossen Stichproben können auch hochsignifikante Beziehungen wenig oder nichts erklären. Wie häufig Signifikanztests missverstanden werden, zeigt sich darin, dass Signifikanztests oft auch bei Vollerhebungen, Zensusdaten oder internationalen Vergleichen, die alle Nationen einer Region einschliessen, benützt werden. Dabei wird vergessen, dass Signifikanztests nur sinnvoll sind, wenn nicht allein eine bestimmte Stichprobengrösse vorhanden ist, sondern es sich gleichzeitig um eine Zufallsauswahl handelt. Auch eine Befragung von dreissigtausend Personen ist nicht repräsentativ, sofern sie nicht nach einem Zufallsverfahren durchgeführt wurde (ein Punkt, der etwa bei grossen Leserumfragen oft vergessen geht).

Die Benützung von Ersatzadressen erhöht zwar die Zahl realisierter Interviews, löst jedoch das Problem der Ausfälle und Verweigerungen - und die damit verbundenen Verzerrungen nicht.

Eine höhere Zahl von Interviews durch Ersatzadressen erhöht die Repräsentativität somit nicht, sie führt bestenfalls zu einer höheren internen Heterogenität der Stichprobe. Mit höherer Zahl an realisierten Interviews nimmt die Zahl von Interviews auch aus schlecht erreichbaren Gruppen mit geringer Interviewbereitschaft zu. Dies führt zwar nicht zu einer Reduktion der Verzerrungen, aber verbessert die Möglichkeit von Gruppenvergleichen.

Durch zusätzliche Interviews via Ersatzadressen wird somit nicht die Repräsentativität der Verteilungswerte (Mittelwerte, Standardabweichungen usw.) erhöht, jedoch im allgemeinen die Stabilität von Gruppenunterschieden. Die im allgemeinen erhöhte interne Heterogenität bei grösserer Interviewzahl erklärt, wieso auch bei wenig repräsentativen Befragungen viele sozialen Gruppenunterschiede ähnlich sind wie bei Repräsentativbefragungen. Generell scheinen soziale Beziehungen (vor allem die Richtung von Gruppenunterschieden) bei hoher Interviewzahl von sozialen Verzerrungen durch Ausfälle und Verweigerungen weniger betroffen zu sein als die Verteilungswerte (allerdings gilt auch dies nur unter Bedingung, dass die Gruppenunterschiede der Ausschöpfungsrate nicht zu krass sind).

Relativ unproblematisch ist die Benützung von Ersatzadressen nur, wenn Personen aus der ursprünglichen Stichprobe nicht oder nicht mehr zur definierten Grundgesamtheit gehören (wie etwa verstorbene Personen). Wie früher erwähnt, führt der Ersatz 'ungültiger Adressen' höchstens dann zu leichten Verzerrungen, wenn auch die Ersatzadressen nicht aktuell sind (und damit beispielsweis Zuzüge weiterhin untervertreten sind).

Die Benützung von Ersatzadressen bei Ausfällen aufgrund von Nichterreichbarkeit führt theoretisch dann zu einer Verbesserung der Stichprobenqualität, wenn die Nichterreichbarkeit in bezug auf zentrale Messvariablen gewissermassen 'zufälligen Charakter' hat. Dies ist allerdings faktisch kaum der Fall, da berufliche Mobilität, Ferienabwesenheit, aber auch Krankheiten bekanntlich sozial selektive Prozesse sind. Bei Ausfällen wegen Nicht-Befragbarkeit und Verweigerungen lässt sich das Problem der damit verbundenen Verzerrungen durch Ersatzadressen nicht lösen.

Auch die hie und da vorgeschlagene Verwendung statistischer Zwillinge löst das Problem nicht, da die zur Nichtbefragbarkeit und Verweigerung führenden Faktoren nicht korrigiert werden können. Die Verwendung statistischer Zwillinge - wie auch ein gezieltes Oversampling schlecht erreichbarer Gruppen - hat dennoch seine Vorteile: Werden nicht-erreichte Personen oder Verweigerer durch Personen ersetzt, die sozio-demographisch die gleichen Merkmale aufweisen (statistische Zwillinge) werden zumindest die sozio-demographischen Verzerrungen (nach Geschlecht, Alter, Haushaltszugehörigkeit, sozialer Schicht) reduziert. Damit kann zumindest die sozio-demographische Repräsentativität der Stichprobe verbessert werden. Dies ist vor allem wichtig, wenn die erhobenen Befragungsdaten auf die Gesamtpopulation hochgerechnet werden sollen und wenn sozio-demographische Variablen (wie Alter, Geschlecht) zentrale Erklärungs- oder Kontrollvariablen darstellen. Dies kann allerdings auch vorgängig, durch eine gezielte Schichtung der Stichprobe erreicht werden.

Inwiefern soziale Verzerrungen damit eliminiert werden, ist weniger klar. Nehmen wir beispielsweise an, dass die erste Befragungsrunde (ohne Ersatzadressen) einen klaren 'Mittelschichts-Bias' zeigt. Werden die Ersatzadressen - sofern möglich - schichtspezifisch geschichtet, kann der Mittelschichts-Bias korrigiert werden. Unterschicht und Mittelschicht wären zum Schluss entsprechend ihrer Verteilung repräsentiert. Nicht gelöst wird damit allerdings das Problem, dass innerhalb der Unterschicht und - weniger ausgeprägt - der Mittelschicht primär die besser integrierten, besser erreichbaren Segmente weiterhin übervertreten sind. Anstelle eines allgemeinen 'Mittelschichtsbias' haben wir zwei gruppenspezifische Verzerrungen. Die Repräsentativität in bezug auf allgemeine Merkmale wird verbessert, die spezifischen, gruppeninternen Verzerrungen bleiben.

c) Nachträgliche Gewichtung von Gruppen: Eine Möglichkeit, um soziale Verzerrungen auszugleichen, besteht darin, die Gruppen mit geringerer Ausschöpfungsrate entsprechend stärker zu gewichten. Dies setzt detaillierte Informationen über die Ausschöpfungsraten nach Merkmalen voraus (z.B. Alter, Geschlecht usw.). Zumindest wird die sozio-demographische Repräsentativität verbessert, was namentlich bei Hochrechnungen bedeutsam ist. Das Problem sozialer Verzerrungen - etwa aufgrund von Verweigerungen - wird damit nicht gelöst. Im schlimmsten Fall kann es sich durch die Gewichtung noch verstärken. Nehmen wir beispielsweise an, dass in einer Bevölkerungsbefragung die Gruppe der 75 und mehr jährigen Personen untervertreten ist (weil nur gesunde, zu Hause lebende Betagte geantwortet haben). Durch eine Uebergewichtung der 75 und mehr jährigen Befragten wird zwar die Altersstruktur 'repräsentativ', aber die Gesundheitsindikatoren werden zusätzlich verzerrt. Gewichtung kann somit nur eine Teillösung sein (deren Konsequenzen genau überprüft werden müssen).

d) Beibezug von zusätzlichen Informationen: Es ist sicherlich ideal, wenn Befragungsdaten durch andere Daten (statistische Daten, institutionelle Informationen) ergänzt werden können. Im Minimalfall können aggregierte Verteilungen verglichen werden, um sozio-demographische Verzerrungen der befragten Population zu überprüfen. Im Maximalfall können individuelle Daten zur Ueberprüfung der Validität von Aussagen und zur Analyse von Ausfällen bzw. Verweigerungen benützt werden.

Namentlich bei Kommunikationsproblemen kann auch das Verfahren von Proxi-Interviews benützt werden: an Stelle der ausgewählten Person wird eine ihr nachstehende Person (Haushaltsangehörige, Nachbarn, Familienangehörige) über diese Person befragt. Sachgemäss können damit nur Tatbestände (und nicht Einstellungen oder subjektive Aspekte) erfasst werden, und die Qualität von Proxi-Interviews variiert je nach Familienzugehörigkeit. Proxi-Interviews bei Verweigerungen sind zwar in einigen Fällen theoretisch möglich, faktisch aber heikel. So ist es beispielsweise nicht ratsam, Informationen über erwerbstätige Verweigerer via Arbeitgeber einzuholen. Tatsächlich werden Proxi-Interview primär bei Nicht-Befragbarkeit (z.B. im Rahmen sozio-medizinischer und gerontologischer Studien) eingesetzt.

e) Analyse der Ausfälle und Verweigerungen: Eine genaue Dokumentation der Ausfälle und Verweigerungen gehört zu jeder sorgfältig durchgeführten Befragungsstudie. Nur so lassen sich Verzerrungen - z.B. durch Vergleich mit Zensus-Daten usw. - und Ausschöpfungsraten überhaupt festhalten. Inwieweit eine Analyse von Verweigerungsgründe möglich ist, ist offen, da die angegebenen Gründe (keine Zeit, kein Interesse) vielfach nicht mit den tatsächlichen Gründen übereinstimmen.

Bei schriftlichen Befragungen hat es sich im übrigen bewährt, Frühantwortende und Spätantwortende miteinander zu vergleichen. Da Spätantwortende im allgemeinen Nicht-Antwortenden ähnlicher sind als Frühantwortende, kann der entsprechende Gruppenvergleich zumindest einige Hinweise auf die Struktur der Nicht-Antwortenden vermitteln.

Bei mündlichen oder telefonischen Interviews kann ein Vergleich zwischen leicht und schwererreichbaren Personen ebenfalls nützlich sein, um Hinweise auf die Struktur der nichterreichbaren Personen zu erhalten.

Eine weitere Methode, zumindest zu einigen Informationen zu gelangen, besteht darin, die jeweilige Befragung durch eine Zweitmethode zu ergänzen. Zum Beispiel kann eine schriftliche Befragung durch eine telefonische Kurzbefragung ergänzt werden, um zumindest einige Merkmale bei Nichtantwortenden zu erhalten. Ebenso kann Personen, die im Rahmen einer mündlichen oder telefonischen Befragung nicht erreicht wurden oder die eine Befragung verweigert werden, ein schriftlicher Kurzfragebogen zugeschickt werden. Damit können zumindest einige sozio-demographische Grundmerkmale erfasst werden. Selbst wenn nur ein Teil der Verweigerer den Ergänzungsfragebogen zurücksenden, vermittelt dies einige Hinweise auf die sozio-demographischen Merkmale der Personen, die das mündliche Interview verweigerten. Zudem lässt sich der Datensatz ergänzen (was z.B. Hochrechnungen auf die Gesamtpopulation erleichtert).

f) Annahmen über die Verweigerer bei der Auswertung: Wenn ein Verdacht auf Verzerrungen der Daten durch Verweigerungen besteht, kann dies bei der Datenauswertung mitberücksichtigt werden. Denkbar sind verschiedene Verfahren. Ein radikales Verfahren besteht darin, Hypothesen unter der Annahme zu testen, alle Verweigerer hätten Antworten gegeben, die der Hypothese widersprechen würde. Sofern die Hypothese auch unter dieser Bedingung Bestand hat bzw. eine Beziehung auch bei dieser Annahme signifikant ist, kann sie durchaus als erhärtet gelten. Diese radikale Strategie führt allerdings bei hohen Verweigerungsquoten zur Relativierung aller Aussagen (was methodisch zwar adequat ist, forschungspraktisch jedoch an die Grenzen der Selbstverleugnung stösst). Ein verfeinertes Verfahren besteht darin, abzuklären, wie hoch der Anteil der Verweigerer mit dem Merkmal x oder der Einstellung y sein müsste, damit die gefundene Beziehung insignifikant wird. Der Realitätsgehalt einer solchen Merkmalsverteilung bei den Verweigern - verglichen mit der Verteilung bei den Befragten - lässt sich zwar nicht beweisen, aber immerhin unter soziologischen Gesichtspunkten diskutieren. In jedem Fall lässt sich die Verallgemeinbarkeit von Aussagen durch solche Kontrollen auch bei Verdacht auf verzerrte Stichproben klar begründen.

Literaturhinweise

Armstrong, J.Scott; Lusk, Edward J. (1987) Return Postage in Mail Surveys: A Meta-Analysis, Public Opinion Quarterly,51: 233-248.

Bétemps, C.; Bickel, J.-F.; Brunner, M.; Hummel, C. (1997) Journal d'une enquête: La récolte des données d'une recherche transversale par échantillon aléatoire stratifié, Lausanne: Réalités Sociales.

Betlehem, J.G.; Kersten, H.M.P. (1981) The nonresponse problem, Survey Methodology 7: 130-156.

Blass-Wilhelms, Wolfgang (1982) Der Einfluss der Frankierungsart auf den Rücklauf von Antwortkarten, Zeitschrift für Soziologie,11: 64-68.

Farago, Peter; Zeugin, Peter (1993) The Telephone Survey: A valid and reliable research method for the social sciences, Schweiz. Zeitschrift für Soziologie, 19: 445-462.

Foddy, William (1993) Constructing Questions for Interviews and Questionnaires. Theory and Practice in Social Research, Cambridge: University Press 1993.

Fox, Richard J.; Crash, Melvin R.; Kim, Jonghoon (1988) Mail Survey Response Rate: A Meta-Analysis of Selected Techniques for Inducing Response, Public Opinion Quarterly,52: 467-491.

Frasch, Gerhard (1987) Der Rücklaufprozess bei schriftlichen Befragungen: formale Modelle zur Analyse kollektiver Regelmässigkeiten, Bern: Lang.

Fuchs, Marek (1994) Umfrageforschung mit Telefon und Computer. Einführung in die computergestützte telefonische Befragung, Weinheim: Beltz.

Gabler, Siegfried; Hoffmeyer-Zlotnik, Jürgen H.P. (Hrsg.) (1997) Stichproben in der Umfragepraxis, Opladen: Westdeutscher Verlag.

Goyder, John (1985) Face-To-Face Interviews and Mailed Questionnaires: The Net Difference in Response Rates, Public Opinion Quarterly,49: 234-252.

Goyder, J. (1987) The Silent Majority, Cambridge: Blackwell.

Hox, Joop. J.; De Leeuw, Edith D. (1994) A Comparison of Nonresponse in Mail, Telephone, and Face-to-face Surveys. Applying multilevel modeling to meta-analysis, Quality & Quantity, 28: 329-344.

Kaldenberg, Dennis O.; Koenig, Harold F.; Becker, Boris W. (1994) Mail Survey Response Rate Patterns in a Population of the Elderly, Public Opinion Quarterly, 58: 68-76.

Kalton, Graham (1983) Introduction to Survey Sampling, Beverly Hills: Sage.

Lindström, Hakan (1983) Non-Response Errors in Sample Surveys, Oerebrö: Statistika Centralbyran.

Reubaud, Karl-Heinz; Blasius, Jörg (1996) Face-to-face, telefonische und postalische Befragungen. Ausschöpfungsquoten und Antwortmuster in einer Grossstadt-Studie, Kölner Zeitschrift für Soziologie und Sozialpsychologie, 48,2: 296-318.

Schnell, Rainer (1991) Wer ist das Volk? Zur faktischen Grundgesamtheit bei 'allgemeinen Bevölkerungsumfragen': Undercoverage, Schwererreichbare und Nichtbefragbare, Kölner Zeitschrift für Soziologie und Sozialpsychologie, 43: 106-137.

Schnell, Rainer (1997) Nonresponse in Bevölkerungsumfragen. Ausmass, Entwicklung und Ursachen, Opladen: Leske & Budrich.

Steeh, Charlotte G. (1981) Trends in Nonresponse Rates,1952-1979, Public Opinion Quarterly,45: 40-57.).

Weeks, Michael; Kulka, Richard A.; Presson, Stephanie A. (1987) Optimal Call Scheduling for a Telephone Survey, Public Opinion Quarterly,51: 540-549.

letzte Aktualisierung: 23.Jan. 2002
Zurück zur Menuseite 'Methoden' /Zurück zur Homepage