Induktive Statistik
Werfen wir jetzt einen Blick darauf, warum wir Wahrscheinlichkeit überhaupt interpretieren müssen. Nehmen wir an, wir interessieren uns für alle Frauen, die 30 Jahre alt sind und in Europa und Nordamerika leben. Wir wollen von diesen vielen Millionen Frauen wissen, wie häufig bei ihnen eine bestimmte Krankheit innerhalb eines Jahres auftritt. Wir suchen nach einer einfachen Häufigkeit. Da wir aber technisch nicht in der Lage sind, alle Frauen in diesem Jahr zu überwachen, wählen wir eine repräsentative Stichprobe aus und erfassen die Häufigkeit der Krankheit in dieser Stichprobe. Die Ergebnisse der Studie übertragen wir dann auf die Grundgesamtheit. Dabei unterstellen wir nicht nur, dass die Studie perfekt durchgeführt wurde, sondern dass auch noch mehrere statistische Annahmen über die Verteilung der Krankheit erfüllt sind.
Nehmen wir an, dass wir wissen wollen, wie viele Bäume geschädigt sind, wie viele Fischarten gefährdet sind, wie sich der Genpool von Nutzpflanzen geändert hat oder wie sich die Bevölkerung in einem südamerikanischen Land in den nächsten 20 Jahren entwickeln wird. Egal welches Problem wir analysieren, wir werden niemals alle Daten erheben und sichten können und wir werden keine sicheren verlässlichen Prognosen über die Zukunft abgeben können. Wir werden immer gezwungen sein, uns auf eine Teilmenge zu beschränken und von dieser Teilmenge auf die Gesamtmenge oder die Zukunft zu schließen. Da wir also von einem Teil auf das Ganze schließen, wird dieser Abschnitt auch „induktive Statistik“ genannt.
Wir werden uns einen Korridor der induktiven Statistik vorstellen, von dem mehrere Räume abgehen, die wir alle nacheinander betreten. In jedem Raum werden wir uns mit einigen grundlegenden Aspekten der induktiven Statistik beschäftigen.