3.11.3.2 Wichtige Anmerkungen zu statistischen Korrelationen und Kausalzusammenhängen
Quellen.
www.statista.com.de/statistik/Lexikonliste „Definition Scheinkorrelation“;
Wikipedia 2023: „Korrelation“, „Vitamin D“.

In der Öffentlichkeit fehlt weitgehend das Bewusstsein für die richtige Einordnung von statistisch gewonnenen Erkenntnissen. Dies ist einerseits schon Defiziten in der Vermittlung korrekter wissenschaftlicher Arbeitsmethoden im Bildungssystem geschuldet, vor allem aber auch der Handhabung dieses Bereichs in den allgegenwärtigen Medien und der Politik. Das Herstellen von Zusammenhängen durch statistische Erhebungen wird vielfach verwechselt mit der Herstellung von Kausalzusammenhängen und öffnet damit die Tür für den ideologischen Missbrauch der Wissenschaft. Das Bewusstsein für diese Problematik zu schärfen ist allgemein angebracht, besonders aber auch für das nachfolgende Kapitel über Epigenetik.

Ein fiktives, aber schönes, weil sofort für jedermann klares Beispiel ist die statistische Feststellung, dass in einem bestimmten Gebiet die Anzahl der Störche und gleichzeitig die Anzahl der Geburten abnimmt. Man sagt dazu, die Anzahl der Störche und die Anzahl der Geburten ist korreliert. Der hier nicht weiter erläuterte Korrelationsfaktor (eine Zahl zwischen 0 und 1) gibt dabei an, wie stark dieser Zusammenhang ist. Wegen des Vorwissens, das jeder Mensch über Geburten und Störche hat, wird niemand auf die Idee kommen, dass hier ein Kausalzusammenhang in der Weise besteht, dass Störche die kleinen Kinder bringen. Vielmehr wird man vermuten, dass ein weiterer unbekannter Sachverhalt die kausale Ursache der beiden statistischen Beobachtungen ist. Diese gemeinsame kausale Ursache könnte z.B. sein, dass in dem Gebiet viele kleine Bauernhöfe mit kleinen naturnahen Flächen und noch viel natürlicher Restvegetation aufgeben, die Flächen verkaufen oder verpachten und verbunden mit einer Flurbereinigung eine großflächige industrielle Landwirtschaft Einzug hält. Dies führt zum Wegzug der Störche und gleichzeitig durch Reduzieren von Arbeitsplätzen zum Wegzug junger Leute, die hier hätten Kinder bekommen können.

Ein nun die Problematik gut beleuchtendes reales Beispiel ist der Vitamin-D-Gehalt im Blut. „Auffällig ist, dass viele (statistische) Studien, die nach einem Zusammenhang zwischen Vitamin-D-Konzentration im Blut und Krankheiten suchten, diesen in der Regel fanden. Auf der anderen Seite kamen (statistische) Studien, die untersuchten, ob Menschen, die zusätzlich Vitamin D einnehmen, mit geringerer Häufigkeit erkranken, häufig zu dem Schluss, dass kein Zusammenhang besteht. Eine Erklärungsmöglichkeit dafür wäre, dass nicht der niedrige Vitamin-D-Spiegel zu einer Krankheit führt, sondern dass die entzündlichen Prozesse, die mit vielen Krankheiten einhergehen, zu einem niedrigen Vitamin-D-Spiegel führen“. Hier wird nun also nach einer gemeinsamen Ursache für die beiden statistisch korrelierten Phänomene „Krankheit“ und „Vitamin-D-Mangel“ gesucht. Die „entzündlichen Prozesse“ sind dabei zunächst nur eine mögliche und vermutete Ursache und werden erst dann zur wissenschaftlich geklärten Ursache, wenn auf der molekularen Ebenen die detaillierten Vorgänge geklärt werden, die einerseits zur Krankheit und andrerseits zum Vitamin-D-Mangel führen.

Eine typische Pressemitteilung zu einer der oben genannten Studien hätte dann in der Zeitungs- und Zeitschriftenwelt möglicher Weise die Überschrift „Forscher stellen Zusammenhang zwischen Vitamin-D-Mangel und Krankheit X her“, wobei allerdings das Wort „statistisch“ schon unterschlagen wird, und im Text schreibt der schon in der Schule nicht sehr mit den Naturwissenschaften befreundete Journalist dann „Vitamin-D-Mangel verursacht Krankheit X“ und stellt damit unzulässiger Weise einen Kausalzusammenhang her, der so gar nicht besteht.