Wahrscheinlichkeitstheorie & Statistik

Hinweise Hinweise zur Beurteilung von statistischen Aussagen.

Bei diesem Beitrag handelt es sich um ein Blog aus der Freitag-Community.
Ihre Freitag-Redaktion

In der Wahrscheinlichkeitstheorie wird anfangs gerne mit Urnenmodellen gearbeitet.

Zunächst ein paar selbstverständliche Grundlagen, aber aus eigener Erfahrung weiß ich noch, daß man später leicht durcheinander kommt.

In einer Urne seien 100 weiße und 900 schwarze Kugeln.

Die Wahrscheinlichkeit, eine weiße Kugel zu ziehen ist 10%. Dieser Wert ergibt sich direkt aus den Anzahlen.

Man kann ohne und mit Zurücklegen ziehen. Mit Zurücklegen bleiben die Wahrscheinlichkeiten gleich. Ziehe ich eine schwarze Kugel ohne Zurücklegen, befinden sich nachher noch 100 weiße und 899 schwarze drin, und die Wahrscheinlichkeit für schwarz fällt auf 899/999, die von weiß steigt auf 100/999.

Bei Ziehungen aus großen Mengen, sprich Statistiken über große Bevölkerungmengen kann man mit dem Modell mit Zurücklgen annähern. In der jetzigen Fassung ist dieser Unterschied noch nicht relevant.

Bedingte Wahrscheinlichkeit und unabhängige Ereignisse.

In einer Urne seien 800 weiße und 200 schwarze Kugeln. 80 schwarze und 160 weiße Kugeln haben zusätzlich einen Kreis, die anderen ein Quadrat auf der Oberfläche. Es wird mit Zurücklegen gezogen.

Die Wahrscheinlichkeit für eine weiße Kugel beträgt 80%.

Die Wahrscheinlichkeit für eine Kugel mit Kreis beträgt 240/1000 = 24%: 160 Weiße und 80 Schwarze haben einen Kreis.

Die Wahrscheinlichkeit für eine weiße Kugel mit Kreis ist 160/1000 = 16%.

Angenommen, man weiß nur, daß man eine weiße Kugel hat, wie groß ist die Wahrscheinlichkeit, daß sie auch ein Kreis hat ?

Es wurde eine der 800 weißen gezogen, davon haben tragen 160 einen Kreis, also ist die Wahrscheinlichkeit dann 160/800 =1/5 =20 %.

Entsprechend ist die Wahrscheinlichkeit dafür, daß sie ein Quadrat trägt, 640/800 = 80%.

Zusammen sind diese Wahrscheinlichkeiten 100%, denn ich weiß ja, daß ich eine weiße Kugel habe. Diese sogenannten bedingten Wahrscheinlichkeiten haben die Eigenschaft, daß sie alle aufsummiert 100% ergeben. Sie teilen diese Teileigenschaften unter der Bedingung ein.

Hat man eine schwarze gezogen, ist die Wahrscheinlichkeit für einen Kreis 80/200 = 40% und dann für ein Quadrat 60 %: es sind 80 schwarze mit Kreis und 120 schwarze mit Quadrat drin.

Wir vergleichen die verschiedenen Fälle von Kugeln mit Kreis:

aus der Gesamtheit gezogen haben wir eine Wahrscheinlichkeit von 24%,

unter der Bedingung einer weißen 20 % und einer schwarzen 80%.

Da es anteilsmäßig weniger weiße Kugeln mit Kreis gibt als überhaupt Kugeln mit Kreis, sinkt die bedingte Wahrscheinlichkeit für einen Kreis, wenn man eine weiße hat. Umgekehrt steigt natürlich die Wahrscheinlichkeit für ein Quadrat.

Hat man eine schwarze Kugel gezogen, ist es genau umgekehrt: die Wahrscheinlichkeit für einen Kreis steigt.

Diese Eigenschaft wirkt sich auf die Statistik im Blog über die Pädophilen aus. Da der Anteil der Pädophilen unter den Mißbrauchern höher ist als unter der Gesamtbevölkerung, steigt die Wahrscheinlichkeit für einen Mißbraucher mit der Eigenschaft Pädophilie, auch wenn deren prozentualer Anteil bei den Mißbrauchern geringer ist als bei den Nicht-Pädophilen.

Man beachte, daß dies aus den Wahrscheinlichkeiten zu errechnen ist, man braucht nicht die absoluten Zahlen wissen: weil diese ja die Wahrscheinlichkeiten erzeugen, mit denen man arbeitet.

ich gestehe ein, daß es doch etwas schwieriger zu erklären ist, als ich dachte. Wenn man es weiß, ist es klar, wenn man es aber jemand ohne Übung und Vorkenntnisse zeigen möchte, merkt man erst die vielen Voraussetzungen, die unbewußt schon dabei sind, wenn man es weiß. Ich werde eine klarere Darstellung versuchen, aber jetzt habe ich leider keine Zeit mehr.

Zwei Merkmale heißen unabhängig voneinander, wenn die bedingten Wahrschlichkeiten gleich den Grundwahrscheinlichkeiten sind.

Intuitiv ist das auch nicht schwer einzusehen: man muß die Quadrate und Kreise gleichmäßig auf die Farben verteilen.

240 Kugeln mit Kreis müssen auf weiß und schwarz kommen: die weißen sind 4/5, also braucht man dann 240 * 4/5 = (240/5)*4 = 48*4 = 192. Entsprechend sind die restlichen 48 Kugeln mit Kreis schwarz. Die Zahlen der Kugeln mit Quadrat sind die jeweiligen Ergänzungen. 800 – 192 = 608 sind weiß mit Quadrat, 200 – 48 = 162 sind schwarz mit Quadrat.

Zieht man eine weiße Kugel, ist die Wahrscheinlichkeit für ein Quadrat jetzt genau so groß wie für eine schwarze, die Merkmale Farbe / Zeichnung sind also unabhängig voneinander.

Kurzfassung

Der Anteil der Pädophilen unter der Gesamtbevölkerung ist 1%. Die Wahrscheinlichkeit für Padophiler unter der Bedingung Mißbraucher liegt zwischen 2% und 10%. Damit kann man über den Wert Mißbraucher unter der Bedingung Pädophiler gewisse Aussagen treffen. Damit die Ereignisse Pädophiler und Mißbraucher unabhängig von einander sind, darf deren Anteil an den Mißbrauchern auch nur 1% sein. Dann wäre die Wahrscheinlichkeit für einen Mißbraucher unter der Bedingung pädophil genau so groß wie unter der Bedingung nicht pädophil. Da dieser Anteil aber 2 bis 10 mal so groß, prozentual gesehen, wie ihr Bevölkerungsanteil ist, wird diese bedingte Wahrscheinlichkeit mit diesem Wert multipliziert.

Man beachte, daß keine Aussagen über die Höhe dieser Werte gemacht werden. Man müßte also den Wert für die Nicht-Pädophilen kennen, um den anderen auszurechnen. Ich habe ihn aber noch nicht gefunden, vielleicht kann das jemand ergänzen ?

Dieser Beitrag gibt die Meinung des Autors wieder, nicht notwendigerweise die der Redaktion des Freitag.
Geschrieben von

alalue

In einer Demokratie darf jeder so blöd sein wie er kann

alalue

Was ist Ihre Meinung?
Diskutieren Sie mit.

Kommentare einblenden