Dirichlet-Verteilung Generator & Visualisierung

Q: Warum korrelieren Komponenten negativ?

Weil alle Komponenten zusammen 1 ergeben müssen, senkt ein höherer Wert einer Komponente tendenziell mindestens eine andere Komponente.

Q: Warum liegen Stichproben an Ecken?

Wenn ein oder mehrere α-Werte unter 1 liegen oder die Gesamtkonzentration klein ist, wandert die Dichte zu den Simplex-Grenzen.

Q: Warum kann eine exportierte Zeile nicht exakt 1 ergeben?

Gerundete Ausgabe kann die exakte Gleichheit verlieren, obwohl die zugrunde liegende Stichprobe vor dem Runden weiterhin 1 ergibt.

Q: Wie unterscheidet sich das von Beta?

Dirichlet behandelt Wahrscheinlichkeitsvektoren; Beta ist der zweikomponentige Spezialfall über eine Komponente.

Q: Was sollte ich zuerst tun?

Starten Sie mit einer niedrigdimensionalen Basis und ändern Sie dann jeweils nur einen α-Wert oder die Konzentration.

Was ist eine Dirichlet-Verteilung?

Eine Dirichlet-Verteilung ist eine Verteilung über Wahrscheinlichkeitsvektoren (x1,…,xK), bei denen jede Komponente nicht negativ ist und die Summe 1 ergibt. Dieser Raum heißt Simplex.

α (Alpha) kann wie Pseudozählungen interpretiert werden. Die relativen Größen von α bestimmen den Mittelwertvektor.
α0 = Σα_i ist die Konzentration (Stärke): größeres α0 bedeutet enger um den Mittelwert, kleineres α0 bedeutet mehr Streuung.
Wenn einige α_i < 1 sind, sind Stichproben eher dünn besetzt und liegen nahe an Ecken oder Kanten; wenn alle α_i > 1 sind, liegt die Masse oft im Inneren des Simplex.
K=2 ist ein Spezialfall: x1 ~ Beta(α1,α2). Dieses Tool zeigt die Beta-Überlagerung und verlinkt zum Beta-Tool.

Typische Anwendungen sind Bayes-Prioren für kategoriale Wahrscheinlichkeiten, Themenanteile, Mischungsgewichte und wahrscheinlichkeitsähnliche Testdaten. Für die Nutzung müssen Sie keine persönlichen Informationen eingeben.

Voreinstellungen

Wählen Sie eine praktische Voreinstellung. Sie erzeugt sofort neu; danach können Sie Werte anpassen.

Tipp: Nutzen Sie bei großem K Profil-JSON statt langer URLs zum Teilen.

Generator

Wählen Sie eine Parametrisierung, erzeugen Sie Stichproben und prüfen Sie Mittelwerte, Randverteilungen und Diagnosen.

Parameterization

Dimension (K) Labels (comma-separated)

α (same for all components)

All components use α_i = α. Good starting point to see “corner vs center”.

Concentration (α0)

Geben Sie einen Mittelwertvektor m ein (Summe 1). Das Tool leitet α = m×α0 ab.

Component	Mean (m_i)

Alle α-Werte müssen >0 sein. Kleinere Werte (<1) begünstigen dünn besetzte Vektoren nahe an Ecken.

Component	α_i

Stichprobengröße (N) Bins (histograms)

RNG

Komponenten anzeigen (Randverteilungen)

Bis zu 5 Komponenten werden für Randhistogramme genutzt. Bei großem K wird die Checkboxliste ausgeblendet; nutzen Sie die Indexeingabe.

Korrelations-Heatmap anzeigen (Theorie; nur kleines K)

Vorschau-Rundung (Dezimalstellen) Export-Rundung (optional) JSON-Modus

Kopierformat (Vorschau)

Kennzahlen je Komponente

Component	Theoretischer Mittelwert	Stichprobenmittel	Theory var	Stichprobenvarianz

Stichprobenvorschau (erste 20)

Profil-JSON (Einstellungen speichern/wiederherstellen)

Geteilte URLs enthalten nur Einstellungen. Bei großem K nutzen Sie Profil-JSON, um Einstellungen ohne lange URLs zu speichern oder wiederherzustellen.

Profil-JSON importieren

Tipp: Nehmen Sie keine vertraulichen Labels wie Kundennamen in geteilte Profile auf.

So nutzen Sie dieses Tool

Nutzen Sie diese Seite, um Wahrscheinlichkeitsvektoren zu erzeugen, deren Komponenten nicht negativ sind und zusammen 1 ergeben müssen.

Nutzung in 3 Schritten

Starten Sie mit einer kleinen Dimension wie K=3 und einer leicht interpretierbaren Voreinstellung.
Erzeugen Sie eine Stichprobe und prüfen Sie theoretische Mittelwerte, Randverteilungen und Zeilenvorschau gemeinsam.
Ändern Sie jeweils nur einen α-Wert oder die Gesamtkonzentration, damit Mittelwert- und Konzentrationseffekte getrennt bleiben.

So lesen Sie das Ergebnis

Jede Zeile ist ein Wahrscheinlichkeitsvektor. Die Mittelwerte zeigen den erwarteten Anteil jeder Komponente, während die Konzentration steuert, wie eng Stichproben am Mittelwert liegen. Da alle Komponenten zusammen 1 ergeben müssen, verringert ein Anstieg einer Komponente den Spielraum der anderen.

Grenzprüfungen

Wenn ein α_i<1 ist, liegt mehr Masse nahe an Simplex-Ecken oder -Kanten.
Gerundete Exporte können eine angezeigte Zeile leicht von der exakten Summe 1 abweichen lassen.
Bei K=2 vergleichen Sie mit dem Beta-Tool, weil es der passende Spezialfall ist.

Häufige Fragen

Warum korrelieren Komponenten negativ?