29/06/2023
In der Welt der Wahrscheinlichkeitsrechnung und Statistik stoßen wir auf verschiedene Verteilungen, die uns helfen, die Ergebnisse zufälliger Ereignisse zu verstehen und vorherzusagen. Zwei wichtige diskrete Wahrscheinlichkeitsverteilungen sind die hypergeometrische Verteilung und die Poisson-Verteilung. Obwohl beide diskrete Ereignisse modellieren, unterscheiden sie sich grundlegend in ihren Annahmen und Anwendungsbereichen. Das Verständnis dieser Unterschiede ist entscheidend, um die richtige Methode zur Analyse Ihrer Daten zu wählen.

Eine Wahrscheinlichkeitsverteilung ordnet jedem möglichen Ergebnis eines statistischen Experiments eine Wahrscheinlichkeit zu. Sie gibt uns Auskunft darüber, wie wahrscheinlich verschiedene Ergebnisse eines zufälligen Ereignisses sind. Die Wahl der richtigen Verteilung hängt stark von der Art des Experiments und den zugrunde liegenden Bedingungen ab.

Die hypergeometrische Verteilung
Die hypergeometrische Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung, die die Wahrscheinlichkeit beschreibt, bei einer festen Anzahl von Ziehungen eine bestimmte Anzahl von "Erfolgen" zu erzielen, wenn die Ziehungen aus einer endlichen Grundgesamtheit stammen und ohne Zurücklegen erfolgen. Stellen Sie sich eine Urne vor, die Kugeln verschiedener Farben enthält. Wenn Sie eine Kugel ziehen und sie nicht wieder in die Urne zurücklegen, ändert sich die Zusammensetzung der verbleibenden Kugeln und somit die Wahrscheinlichkeit, beim nächsten Zug eine bestimmte Farbe zu ziehen.
Diese "ohne Zurücklegen"-Bedingung ist das definierende Merkmal der hypergeometrischen Verteilung und unterscheidet sie stark von der Binomialverteilung, bei der die Ziehungen mit Zurücklegen erfolgen (oder aus einer unendlich großen Grundgesamtheit stammen), sodass die Wahrscheinlichkeit bei jedem Versuch konstant bleibt.
Die hypergeometrische Verteilung wird durch drei Parameter bestimmt:
- N: Die Gesamtgröße der Grundgesamtheit (z.B. die Gesamtzahl der Kugeln in der Urne).
- K (oder M): Die Anzahl der "Erfolgselemente" in der Grundgesamtheit (z.B. die Anzahl der Kugeln einer bestimmten Farbe, die Sie ziehen möchten).
- n: Die Anzahl der Ziehungen oder die Größe der Stichprobe.
Die hypergeometrische Verteilung wird verwendet, wenn die Stichproben ohne Zurücklegen aus einer relativ kleinen Grundgesamtheit entnommen werden. Ein klassisches Beispiel ist die Qualitätskontrolle, bei der eine Stichprobe von Artikeln aus einer Lieferung entnommen wird, um die Anzahl der defekten Artikel zu ermitteln. Da die geprüften Artikel nicht in die Lieferung zurückgelegt werden, ist dies ein Szenario ohne Zurücklegen.
Die Wahrscheinlichkeit, genau x Erfolge in n Ziehungen zu erzielen, wird durch eine Formel berechnet, die auf Binomialkoeffizienten basiert und die Anzahl der Möglichkeiten berücksichtigt, x Erfolge aus K Elementen und (n-x) Misserfolge aus (N-K) Elementen zu ziehen, geteilt durch die Gesamtzahl der Möglichkeiten, n Elemente aus N zu ziehen.
Die Poisson-Verteilung
Die Poisson-Verteilung ist ebenfalls eine diskrete Wahrscheinlichkeitsverteilung, die jedoch die Wahrscheinlichkeit beschreibt, dass eine bestimmte Anzahl von Ereignissen in einem festen Zeit- oder Raumintervall auftritt, wenn diese Ereignisse mit einer bekannten durchschnittlichen Rate und unabhängig voneinander eintreten. Im Gegensatz zur hypergeometrischen Verteilung, die sich mit Stichproben aus einer endlichen Grundgesamtheit befasst, modelliert die Poisson-Verteilung das Zählen von Ereignissen über ein Kontinuum (Zeit, Raum etc.).
Die Poisson-Verteilung wird oft verwendet, um seltene Ereignisse zu modellieren, obwohl sie auch für häufigere Ereignisse anwendbar ist, solange die Bedingungen erfüllt sind. Beispiele sind die Anzahl der Telefonanrufe, die in einer Stunde in einem Callcenter eingehen, die Anzahl der Kunden, die pro Minute an einem Schalter ankommen, oder die Anzahl der Druckfehler pro Buchseite.
Das Schlüsselmerkmal der Poisson-Verteilung ist, dass die Anzahl der "Versuche" (die potenziellen Gelegenheiten, bei denen ein Ereignis auftreten könnte) unbekannt oder unendlich groß ist, aber die durchschnittliche Rate des Auftretens der Ereignisse (oft mit λ - Lambda bezeichnet) über das betrachtete Intervall konstant ist. Die Ereignisse treten zufällig und unabhängig voneinander auf.

Die Poisson-Verteilung wird durch einen einzigen Parameter bestimmt:
- λ (Lambda): Die durchschnittliche Anzahl der Ereignisse, die in einem festen Intervall (Zeit, Raum etc.) erwartet werden.
Die Wahrscheinlichkeit, genau x Ereignisse in einem Intervall zu beobachten, wird durch eine Formel berechnet, die auf der Rate λ und der Exponentialfunktion basiert.
Wichtige Unterschiede zwischen hypergeometrischer und Poisson-Verteilung
Die fundamentalen Unterschiede zwischen diesen beiden Verteilungen lassen sich anhand mehrerer Kriterien zusammenfassen:
| Merkmal | Hypergeometrische Verteilung | Poisson-Verteilung |
|---|---|---|
| Art der Ziehung/des Prozesses | Stichprobe ohne Zurücklegen aus einer endlichen Grundgesamtheit. | Zählen von Ereignissen über ein festes Intervall (Zeit, Raum). |
| Anzahl der Versuche/Ziehungen | Fest (Stichprobengröße n). | Unbekannt oder unendlich groß (die Anzahl der Ereignisse ist die Zufallsvariable). |
| Wahrscheinlichkeit pro Versuch | Veränderlich (hängt von den vorherigen Ziehungen ab). | Konstant (durch die durchschnittliche Rate λ gegeben). |
| Unabhängigkeit der Ereignisse | Die Ziehungen sind voneinander abhängig. | Die Ereignisse treten unabhängig voneinander auf. |
| Kontext | Ziehen von Elementen aus einer begrenzten Menge. | Auftreten von Ereignissen über Zeit oder Raum. |
| Parameter | N (Grundgesamtheit), K (Erfolge in N), n (Stichprobe). | λ (durchschnittliche Rate pro Intervall). |
Der entscheidende Unterschied liegt in der Frage, ob die Ziehungen ohne Zurücklegen erfolgen und somit die Wahrscheinlichkeiten für nachfolgende Ziehungen beeinflussen (hypergeometrisch), oder ob wir die Anzahl unabhängiger Ereignisse in einem festen Rahmen zählen, basierend auf einer durchschnittlichen Rate (Poisson).
Beziehung zu anderen Verteilungen
Es ist interessant festzustellen, wie diese Verteilungen mit anderen verwandt sind.
Beziehung zur Binomialverteilung
Wie bereits erwähnt, ist die Binomialverteilung das Pendant zur hypergeometrischen Verteilung, wenn die Ziehungen *mit* Zurücklegen erfolgen oder die Grundgesamtheit sehr groß ist. Tatsächlich kann die Binomialverteilung eine gute Annäherung an die hypergeometrische Verteilung sein, wenn die Stichprobengröße im Vergleich zur Grundgesamtheit klein ist (oft als Faustregel < 5% der Grundgesamtheit genannt). In diesem Fall ist der Effekt des Nicht-Zurücklegens auf die Wahrscheinlichkeiten vernachlässigbar.
Beziehung zur Multinomialverteilung und multivariaten hypergeometrischen Verteilung
Die hypergeometrische Verteilung kann auf den Fall erweitert werden, dass es mehr als zwei mögliche Ergebnisse pro Ziehung gibt (z.B. Ziehen von Kugeln in mehr als zwei Farben). Dies führt zur multivariaten hypergeometrischen Verteilung. Diese ist wiederum das Gegenstück zur Multinomialverteilung (dem Pendant zur Binomialverteilung für mehr als zwei Ergebnisse), wobei die multivariate hypergeometrische Verteilung das Ziehen ohne Zurücklegen modelliert, während die Multinomialverteilung das Ziehen *mit* Zurücklegen modelliert.
Beziehung zur Poisson-Annäherung der Binomialverteilung
Die Poisson-Verteilung kann auch als Annäherung an die Binomialverteilung verwendet werden, wenn die Anzahl der Versuche (n) groß und die Erfolgswahrscheinlichkeit (p) klein ist. In diesem Fall ist der Erwartungswert np, und dieser Wert wird als λ für die Poisson-Verteilung verwendet. Dies unterstreicht die Rolle der Poisson-Verteilung bei der Modellierung seltener Ereignisse über eine große Anzahl von Gelegenheiten.
Anwendung und Berechnung
Die Anwendung dieser Verteilungen erfordert die Identifizierung des richtigen Modells für das vorliegende Problem. Handelt es sich um eine Stichprobe aus einer endlichen Menge ohne Zurücklegen? Dann ist es wahrscheinlich die hypergeometrische Verteilung. Zählen Sie Ereignisse über ein festes Intervall mit einer durchschnittlichen Rate? Dann ist die Poisson-Verteilung das passende Modell.
Die Berechnung von Wahrscheinlichkeiten mit diesen Verteilungen kann manuell mit den entsprechenden Formeln erfolgen, die oft Binomialkoeffizienten (für die hypergeometrische Verteilung) oder die Exponentialfunktion und Fakultäten (für die Poisson-Verteilung) beinhalten. In der Praxis werden diese Berechnungen jedoch häufig mithilfe von Statistiksoftware, Tabellenkalkulationsprogrammen oder wissenschaftlichen Taschenrechnern durchgeführt, die entsprechende Funktionen oder die Möglichkeit zur Eingabe der Formeln bieten.

Auch wenn es auf manchen Taschenrechnern keine vordefinierte Funktion für die gesamte Verteilung gibt, können einzelne Wahrscheinlichkeiten oft durch Eingabe der Formel unter Verwendung von Kombinationsfunktionen (nCr) berechnet werden, wie am Beispiel der hypergeometrischen Verteilung auf einem TI-84 Rechner gezeigt wurde.
Häufig gestellte Fragen (FAQ)
Ist die hypergeometrische Verteilung mit Zurücklegen?
Nein, die hypergeometrische Verteilung modelliert das Ziehen von Elementen ohne Zurücklegen aus einer endlichen Grundgesamtheit.
Wann verwende ich die hypergeometrische Verteilung?
Sie verwenden die hypergeometrische Verteilung, wenn Sie die Wahrscheinlichkeit für eine bestimmte Anzahl von Erfolgen in einer Stichprobe berechnen möchten, die ohne Zurücklegen aus einer endlichen Grundgesamtheit gezogen wurde.
Wann verwende ich die Poisson-Verteilung?
Sie verwenden die Poisson-Verteilung, um die Wahrscheinlichkeit für eine bestimmte Anzahl von Ereignissen zu modellieren, die in einem festen Zeit- oder Raumintervall auftreten, wenn die Ereignisse unabhängig voneinander und mit einer konstanten durchschnittlichen Rate eintreten.
Sind die Ziehungen oder Ereignisse bei diesen Verteilungen unabhängig?
Bei der hypergeometrischen Verteilung sind die Ziehungen voneinander abhängig, da das Entfernen eines Elements die Wahrscheinlichkeiten für nachfolgende Ziehungen ändert. Bei der Poisson-Verteilung wird angenommen, dass die Ereignisse unabhängig voneinander auftreten.
Können diese Verteilungen einander annähern?
Ja, die Binomialverteilung kann die hypergeometrische Verteilung annähern, wenn die Stichprobengröße klein im Vergleich zur Grundgesamtheit ist. Die Poisson-Verteilung kann die Binomialverteilung annähern, wenn die Anzahl der Versuche groß und die Erfolgswahrscheinlichkeit klein ist.
Zusammenfassend lässt sich sagen, dass die Wahl zwischen hypergeometrischer und Poisson-Verteilung von den spezifischen Bedingungen des statistischen Experiments abhängt. Berücksichtigen Sie immer, ob die Ziehungen mit oder ohne Zurücklegen erfolgen, ob die Anzahl der Versuche fest oder unbekannt ist und ob die Ereignisse voneinander unabhängig sind. Mit diesem Wissen können Sie das passende Modell auswählen, um die Wahrscheinlichkeiten in Ihrer Analyse korrekt zu bestimmen.
Wenn du mehr spannende Artikel wie „Hypergeometrisch vs. Poisson erklärt“ entdecken möchtest, schau doch mal in der Kategorie Bürobedarf vorbei!
