Was ist eine Dirichlet-Verteilung?
Eine Dirichlet-Verteilung ist eine Verteilung über Wahrscheinlichkeitsvektoren (x1,…,xK), bei denen jede Komponente nicht negativ ist und die Summe 1 ergibt. Dieser Raum heißt Simplex.
- α (Alpha) kann wie Pseudozählungen interpretiert werden. Die relativen Größen von α bestimmen den Mittelwertvektor.
- α0 = Σα_i ist die Konzentration (Stärke): größeres α0 bedeutet enger um den Mittelwert, kleineres α0 bedeutet mehr Streuung.
- Wenn einige α_i < 1 sind, sind Stichproben eher dünn besetzt und liegen nahe an Ecken oder Kanten; wenn alle α_i > 1 sind, liegt die Masse oft im Inneren des Simplex.
- K=2 ist ein Spezialfall:
x1 ~ Beta(α1,α2). Dieses Tool zeigt die Beta-Überlagerung und verlinkt zum Beta-Tool.
Typische Anwendungen sind Bayes-Prioren für kategoriale Wahrscheinlichkeiten, Themenanteile, Mischungsgewichte und wahrscheinlichkeitsähnliche Testdaten. Für die Nutzung müssen Sie keine persönlichen Informationen eingeben.
Voreinstellungen
Wählen Sie eine praktische Voreinstellung. Sie erzeugt sofort neu; danach können Sie Werte anpassen.
Tipp: Nutzen Sie bei großem K Profil-JSON statt langer URLs zum Teilen.
Generator
Wählen Sie eine Parametrisierung, erzeugen Sie Stichproben und prüfen Sie Mittelwerte, Randverteilungen und Diagnosen.
Kennzahlen je Komponente
| Komponente | Theoretischer Mittelwert | Stichprobenmittel | Theoretische Varianz | Stichprobenvarianz |
|---|
Stichprobenvorschau (erste 20)
Profil-JSON (Einstellungen speichern/wiederherstellen)
Geteilte URLs enthalten nur Einstellungen. Bei großem K nutzen Sie Profil-JSON, um Einstellungen ohne lange URLs zu speichern oder wiederherzustellen.
Tipp: Nehmen Sie keine vertraulichen Labels wie Kundennamen in geteilte Profile auf.
So nutzen Sie dieses Tool
Nutzen Sie diese Seite, um Wahrscheinlichkeitsvektoren zu erzeugen, deren Komponenten nicht negativ sind und zusammen 1 ergeben müssen.
Nutzung in 3 Schritten
- Starten Sie mit einer kleinen Dimension wie
K=3und einer leicht interpretierbaren Voreinstellung. - Erzeugen Sie eine Stichprobe und prüfen Sie theoretische Mittelwerte, Randverteilungen und Zeilenvorschau gemeinsam.
- Ändern Sie jeweils nur einen
α-Wert oder die Gesamtkonzentration, damit Mittelwert- und Konzentrationseffekte getrennt bleiben.
So lesen Sie das Ergebnis
Jede Zeile ist ein Wahrscheinlichkeitsvektor. Die Mittelwerte zeigen den erwarteten Anteil jeder Komponente, während die Konzentration steuert, wie eng Stichproben am Mittelwert liegen. Da alle Komponenten zusammen 1 ergeben müssen, verringert ein Anstieg einer Komponente den Spielraum der anderen.
Grenzprüfungen
- Wenn ein
α_i<1ist, liegt mehr Masse nahe an Simplex-Ecken oder -Kanten. - Gerundete Exporte können eine angezeigte Zeile leicht von der exakten Summe 1 abweichen lassen.
- Bei
K=2vergleichen Sie mit dem Beta-Tool, weil es der passende Spezialfall ist.