Was ist eine Dirichlet-Verteilung?
Eine Dirichlet-Verteilung ist eine Verteilung über Wahrscheinlichkeitsvektoren (x1,…,xK), bei denen jede Komponente nicht negativ ist und die Summe 1 ergibt. Dieser Raum heißt Simplex.
- α (Alpha) kann wie Pseudozählungen interpretiert werden. Die relativen Größen von α bestimmen den Mittelwertvektor.
- α0 = Σα_i ist die Konzentration (Stärke): größeres α0 bedeutet enger um den Mittelwert, kleineres α0 bedeutet mehr Streuung.
- If some α_i < 1, samples tend to be sparse and stick to corners/edges; if all α_i > 1, mass is often inside the simplex.
- K=2 is a special case:
x1 ~ Beta(α1,α2)(this tool shows the Beta overlay and links to the Beta tool).
Common use cases: Bayesian priors for categorical probabilities, topic proportions, mixture weights, and probability‑like test data. You don’t need to enter personal information to use it.
Voreinstellungen
Wählen Sie eine praktische Voreinstellung. Sie erzeugt sofort neu; danach können Sie Werte anpassen.
Tipp: Nutzen Sie bei großem K Profil-JSON statt langer URLs zum Teilen.
Generator
Wählen Sie eine Parametrisierung, erzeugen Sie Stichproben und prüfen Sie Mittelwerte, Randverteilungen und Diagnosen.
Kennzahlen je Komponente
| Component | Theoretischer Mittelwert | Stichprobenmittel | Theory var | Stichprobenvarianz |
|---|
Stichprobenvorschau (erste 20)
Profil-JSON (Einstellungen speichern/wiederherstellen)
Geteilte URLs enthalten nur Einstellungen. Bei großem K nutzen Sie Profil-JSON, um Einstellungen ohne lange URLs zu speichern oder wiederherzustellen.
Tipp: Nehmen Sie keine vertraulichen Labels wie Kundennamen in geteilte Profile auf.
So nutzen Sie dieses Tool
Nutzen Sie diese Seite, um Wahrscheinlichkeitsvektoren zu erzeugen, die nicht negativ bleiben und zusammen 1 ergeben müssen.
Nutzung in 3 Schritten
- Starten Sie mit einer kleinen Dimension wie
K=3und einer leicht interpretierbaren Voreinstellung. - Erzeugen the sample, then review theoretical means, marginals, and row previews together.
- Ändern Sie jeweils nur einen
α-Wert oder die Gesamtkonzentration, damit Mittelwert- und Konzentrationseffekte getrennt bleiben.
So lesen Sie das Ergebnis
Jede Zeile ist ein Wahrscheinlichkeitsvektor. Die Mittelwerte zeigen den erwarteten Anteil jeder Komponente, während die Konzentration steuert, wie eng Stichproben am Mittelwert liegen. Da alle Komponenten zusammen 1 ergeben müssen, verringert ein Anstieg einer Komponente den Spielraum der anderen.
Grenzprüfungen
- If any
α_i<1, expect more mass near simplex corners or edges. - Rounded exports can make a displayed row look slightly different from an exact sum of 1.
- When
K=2, compare with the Beta tool because it is the matching special case.