Deskriptive (beschreibende) Statistik
In den folgenden Kapiteln werden wir uns ein äußerst wichtiges Instrumentarium zum Verstehen unserer modernen Welt erarbeiten. Wir werden lernen, wie wir aus Daten, die uns präsentiert werden, möglichst viele relevante Informationen herauslesen können. Wir werden begreifen, welche minimalen Qualitätsanforderungen alle Daten erfüllen sollten, um sie überhaupt sinnvoll und reproduzierbar interpretieren zu können. Wir werden diese Kenntnisse zu schätzen wissen, weil sie uns leiten werden, alle Daten ehrlich und gewissenhaft zusammenzustellen, um sie anderen Menschen widerspruchsfrei und adäquat präsentieren zu können. Durch die einfachen Methoden, die wir jetzt kennenlernen werden, soll die Begeisterung geweckt werden, uns kritisch und auch selbstkritisch mit Daten auseinanderzusetzen. Zugleich werden wir uns damit für eventuelle Betrügereien wappnen und auch deutlich seltener hinters Licht führen lassen. Wenn wir nämlich wissen, worauf wir achten müssen, damit uns keiner hintergeht, dann wird es einem potentiellen Schwindler deutlich erschwert, uns zu betrügen.
Egal, welche Medien wir verwenden und wohin wir blicken, überall werden uns Informationen angeboten und häufig sogar richtig aufgedrängt. Und da wir keine Zeit haben, uns mit allen intensiv auseinanderzusetzen, werden uns statt der „richtigen“ Informationen nur „Kurzinformationen“ angeboten. Es sind unvollständige Informationen, die uns häufig nur zu dem Zweck untergejubelt werden, uns zu manipulieren, uns zu bestimmten Entscheidungen zu drängen oder in uns eine bestimmte Meinung zu erzeugen. Dabei ist es völlig egal, woher die Informationen kommen, ob sie aus alltäglichen Befragungen oder wissenschaftlichen Untersuchungen stammen. Wenn wir solchen unvollständigen Informationen ausgesetzt sind, dann sind Täuschung und Betrug Tür und Tor geöffnet.
Als Grundprinzip gilt, dass wir Daten nicht blind vertrauen werden. Den Informationen sehen wir nicht auf den ersten Blick an, welche Qualität und Aussagekraft in ihnen steckt. Nehmen wir zum Beispiel an, dass in der Zeitung steht, dass 83,3 Prozent aller befragten Ärzte von der positiven Wirkung eines neuen Medikamentes überzeugt sind. Glauben wir diesen Angaben? Schließlich handelt es sich um eine einfache, sehr verständliche Aussage. Oder bleiben wir misstrauisch, weil die angegebene Prozentzahl fast genau 5/6 entspricht? Wir wissen aus der Kurzinformation nicht, wie viele Ärzte tatsächlich befragt worden sind. Es könnten nur sechs Ärzte befragt worden sein, von denen fünf positiv gestimmt haben. Es könnten aber auch in einer sehr umfangreichen Studie 600 Ärzte befragt worden sein, in der 501 eine positive Empfehlung abgaben. Ändert sich die Bedeutung der obigen Aussage, wenn wir wüssten, wie viele Ärzte befragt wurden? Würden wir eher einer Studie mit sechs oder 600 Ärzten vertrauen? Erst jetzt erkennen wir das potentielle Problem in der Aussage: Die Prozentangabe. Die ausschließliche Angabe von Prozenten ist im Alltag zwar ein sehr häufiges Mittel, um uns eine verständliche und einfache Übersicht zu ermöglichen, sie ist aber zugleich sehr gefährlich und manchmal bewusst irreführend, wenn nicht genau bekannt ist, auf welche Gesamtheit sich die Prozentangaben beziehen. Darauf werden wir später noch genauer eingehen.
Werfen wir einen kurzen Blick auf die politische Bühne. Sind wir nicht alle immer wieder verwundert, wie sich verschiedene politische Parteien auf dieselben Daten stützen und sie völlig unterschiedlich interpretieren? Da werden manchmal dieselben wissenschaftlichen Untersuchungen zitiert, aber konträr ausgelegt. Wie ist so etwas möglich? Können wir nicht erwarten, dass etwas entweder so ist oder nicht? Ein anderes Mal werden völlig verschiedene, sich zum Teil stark widersprechende Aussagen über denselben Tatbestand getroffen. Wie kann das sein? Warum ist für den einen Betrachter ein Bär zu klein und für den anderen zu groß? Warum hält der eine das Fell des Eisbären für zu hell und der andere für zu dunkel? Warum behauptet die eine Studie, dass der Wald stirbt, und die andere, dass es sich um eine normale Variabilität handelt?