Der Duden erläutert die Bedeutung von normal mit «der Norm entsprechend, vorschriftsmässig» und mit «so, wie es sich die allgemeine Meinung als das Übliche, Richtige vorstellt.» So gibt es beispielsweise vom Deutschen Institut für Normung (DIN) den Papiergrössenstandart, der besagt, dass ein A4-Blatt immer die Masse 210 x 297 mm aufweist. Normal ist aber also auch das Übliche, das Durchschnittliche. Für Variablen wie zum Beispiel die Körpergrösse, das Einkommen oder die Intelligenz in einer Bevölkerung lässt sich die sogenannte Normalverteilung mit der Gauss’schen Glocke darstellen. Doch hilft uns die Statistik beim Verstehen der Welt? Oder verzerrt sie sie gar?
Natalie Ehrenzweig, Weltgesellschaft und Weltpolitik
Leonie Bisang, immer wieder stossen wir auf Statistiken und Durchschnittswerte. Was bedeutet für Sie als Wissenschaftlerin der Begriff «Durchschnitt»?
Für mich ist der «Durchschnitt» eine deskriptive statistische Kenngrösse für metrisch skalierte Variablen. Er wird auch «arithmetisches Mittel» genannt und gibt den Schwerpunkt einer Verteilung wieder. Zur Berechnung teilt man die Summe aller Beobachtungen durch die Anzahl Beobachtungen. Weil alle Beobachtungen in die Berechnung einfliessen, können extreme Werte das arithmetische Mittel verzerren und je nach Verteilung der Daten kann der klassische «Durchschnitt» täuschen. Neben dem arithmetischen Mittel sind deshalb weitere Kenngrössen gebräuchlich: Der getrimmte Durchschnitt, der empirische Median und der Modus sind gegen Ausreisser robust, bilden jedoch die Verteilung auch nicht vollständig ab. Wir greifen deshalb oft auf die Visualisierung der Verteilung zurück, so dass wir die Datenlage erfassen können, und geben Streuungsmasse an.
Das Bundesamt für Statistik und zahllose andere Untersuchungen ermitteln Durchschnittswerte, die uns als Bevölkerung beschreiben. Worin besteht bei solchen Durchschnittswerten die Herausforderung?
Der Durchschnitt ist allgemein verständlich und deshalb geeignet, um Informationen zu verbreiten. Unter anderem können jedoch – wie bereits angedeutet – Ausreisser oder auch Nullwerte den Durchschnittswert stark beeinflussen: Nehmen wir an, wir haben sieben Studierende nach ihrer Schlafzeit in der letzten Nacht gefragt. Sechs davon antworten mit einer Zahl zwischen sieben und acht Stunden. Der Durchschnitt dieser sechs Personen liegt entsprechend zwischen sieben und acht Stunden. Nehmen wir die Antwort der siebten Person dazu, die nur eine Stunde Schlaf angegeben hat, verändert sich der Durchschnitt zu einem Wert zwischen sechs und sieben Stunden. Die Aussage, der Durchschnitt liegt bei einem Wert zwischen sechs und sieben Stunden ist korrekt, jedoch verlieren wir die Mehrheit der Fälle aus dem Blick. Robuste Kenngrössen, z.B. ein getrimmtes Mittel, bei dem ein gewisser Anteil der extremen Fälle für die Berechnung des arithmetischen Mittels weggelassen wird, könnten in diesem Fall die «grosse Masse» der Fälle treffender zusammenfassen.
Ist es für Sie als Wissenschaftlerin spannender, sich mit dem Durchschnitt zu beschäftigen oder mit den Rändern der Normalverteilung?
Durchschnittswerte sind interessant, wenn wir uns mit der Gesamtpopulation beschäftigen und wissen wollen, wie diese sich im Durchschnitt verhält. Auch, wenn wir uns für Veränderungen über die Zeit interessieren. Die Kennzahl ist einfach fassbar, im Allgemeinen bekannt und kann mit lediglich einer Zahl ausgedrückt werden. Oft ist es in einem ersten Schritt jedoch wichtig, die Verteilung (visuell) zu betrachten. Ist sie symmetrisch und bestehen keine Ausreisser, können Durchschnittswerte durchaus spannende Einblicke in und vor allem auch eine gute Übersicht über die Daten geben. Je nach Fragestellung können aber auch Einzelfälle oder Durchschnittswerte von Subgruppen interessant und erklärungsbedürftig sein, zum Beispiel, wenn man nach Erklärungen für Abweichungen fragt.
Als Forscherin sind Sie mit Mittel- bzw. Durchschnittswerten konfrontiert. Wie definieren Sie in diesem Zusammenhang «normal»?
«Normal» ist eine Kategorie, die wir äusserst selten verwenden. Vielmehr versuchen wir Werte zueinander in Bezug zu setzen. Die Kategorien, die wir dann verwenden, sind «grösser», «kleiner» und «gleich». In der Medizin beispielsweise erscheint die Unterscheidung von «gesund», das heisst «normal», und «krank» jedoch als ein wichtiger Aspekt.
Gerade während der Pandemie kam die Bevölkerung mit vielen statistischen Werten und wissenschaftlichen Studien in Kontakt. Hatten Sie den Eindruck, dass die Werkzeuge, um damit umgehen zu können, vorhanden waren?
Für die Medien werden Studienergebnisse häufig vereinfacht, so dass es auch Laien verstehen können – das ist wichtig und gut, wenngleich Differenzierungen verloren gehen. Das Zusammenfassen von Verteilungen mittels Durchschnittswerten ohne weitere Kennzahlen ist eine dieser Strategien. Bezüglich Durchschnittsaussagen bin ich mir nicht sicher, ob durchweg das Bewusstsein darüber vorhanden ist, was sie bedeuten und was durch den Durchschnittswert nicht kommunizierbar ist. Manchmal wird wohl davon ausgegangen, dass alle Personen diesem Wert entsprechen oder entsprechen müssten. Auch Personen, denen die Definition des Durchschnitts geläufig ist, können Schwierigkeiten bei dessen Interpretation haben, weil wichtige Angaben fehlen: Die Abweichungen vom Durchschnitt werden nicht abgebildet und werden unsichtbar, was insbesondere für Minderheiten problematisch und sogar diskriminierend sein kann.
Können Sie ein Beispiel machen?
Im Jahr 2019 lag das durchschnittlich verfügbare Einkommen der Schweizer Privathaushalte bei CHF 6609 pro Monat (siehe Haushaltsbudgeterhebung des BFS). Gehen wir nun davon aus, dass alle Haushalte CHF 6609 pro Monat zur Verfügung haben, weil wir die Verteilung des Einkommens nicht berücksichtigen, können wir falsche Schlüsse ziehen: Es gibt Haushalte, die haben weniger als CHF 2000 zur Verfügung, andere hingegen mehr als CHF 18’000. Es ist sehr wichtig, diese Streuung im Hinterkopf zu behalten, wenn wir die Durchschnittswerte als Entscheidungsgrundlage heranziehen.
Wie können wir als Gesellschaft beim Verstehen von Statistiken Fortschritte machen?
Mehr Statistikkurse für alle! 😉 Nein, es ist wichtig, dass zum Beispiel in den Medien – insbesondere bei politisch wichtigen Themen (z.B. Covid, Altersvorsorge, Migration) – der eingeschränkte Informationsgehalt erläutert wird. Wünschenswert wäre beispielsweise, dass der range (Minimum und Maximum) mitangegeben wird, so dass die Leserinnen und Leser sich ein (grobes) Bild der Verteilung machen können.
Leonie Bisang arbeitet ab August bei Prof. Dr. Rainer Diaz-Bone. Die Soziologin hat an der Universität Luzern studiert und im Anschluss noch ein DAS in Applied Statistics an der ETH Zürich absolviert.
Der Durchschnittsschweizer – die Durchschnittsschweizerin
Zahllose Statistiken, Untersuchungen und Umfragen zum Wesen des Schweizers und der Schweizerin – bisher werden nur Daten für Frauen und Männer erhoben – bieten Daten darüber, wie die Schweizer Durchschnittsperson ist. Hier eine willkürliche Auswahl:
Er ist 1.77 m gross und wiegt 85.5 kg, sie misst 1.64 m und ist 63.9 kg schwer. Die Durchschnittsschweizerin heiratet mit 29.6 Jahren, während ihr Ehegatte dabei 31.8 Jahre alt ist. Mit 31.6 Jahren gebärt sie das erste von 1.52 Kindern. Das Durchschnittsehepaar bleibt 14.7 Jahre verheiratet. Sein Penis ist 14.35 cm lang – in erigiertem Zustand. Sie hat Körbchengrösse C.
Pro Woche arbeitet der Mann 19.3 Stunden im Haushalt, sie 30.2 Stunden. Dazu kommen bei ihr 20.7 Stunden Erwerbsarbeit, bei ihm 31 Stunden. Der Medianlohn beträgt 6665 Franken pro Monat. Sie unternehmen – vor Corona – 2.8 Reisen pro Jahr.
Für Sport gibt er pro Jahr 2308 Fr. aus, sie hingegen nur 1576 Fr. Wenn sie Sport treiben, dann gleich 4.5 Sportarten. Sie gehen 3.2-mal pro Jahr zum Allgemeinmediziner oder zur Allgemeinmedizinerin und 1.7-mal zur Zahnärztin oder zum Zahnarzt. Wer ins Alters- oder Pflegeheim kommt, verbringt dort 914 Tage. Der Durchschnittsschweizer hat bei der Geburt eine Lebenserwartung von 80.12, die Durchschnittsschweizerin von 84.47 Jahren