Générateur et visualiseur de distribution de Dirichlet

Générez des vecteurs de probabilités avec une distribution de Dirichlet, puis analysez la moyenne théorique, les marginales et les graphiques.

Tout fonctionne dans votre navigateur ; rien n’est envoyé. Les URL de partage contiennent uniquement les réglages, jamais les échantillons générés.

Le mode sécurisé utilise un CSPRNG. Le mode avec graine sert à la reproductibilité, pas au secret.

Autres langues 日本語 | English | Español | Français

Qu’est-ce qu’une distribution de Dirichlet ?

La distribution de Dirichlet est une loi définie sur des vecteurs de probabilités (x1,…,xK) où chaque composante est positive ou nulle et où la somme vaut 1. Cet espace est appelé simplexe.

Cas d’usage fréquents : priors bayésiens pour des probabilités catégorielles, parts de sujets, poids de mélange ou données de test de type probabilité.

Préréglages

Choisissez un préréglage utile ; il régénère aussitôt et vous pouvez ensuite affiner les valeurs.

Astuce : pour les grands K, utilisez le profil JSON plutôt qu’une URL très longue.

Générateur

Choisissez une paramétrisation, générez des échantillons, puis examinez les moyennes, les marginales et les diagnostics.

Toutes les composantes utilisent α_i = α. C’est un bon point de départ pour voir l’effet “coins contre centre”.

Composantes à afficher (marginales)

Jusqu’à 5 composantes sont utilisées pour les histogrammes marginaux. Pour les grands K, utilisez le champ d’indices.

Statistiques par composante

Composante Moyenne théorique Moyenne observée Variance théorique Variance observée

Aperçu des échantillons (20 premiers)

Profil JSON (enregistrer ou restaurer les réglages)

Les URL de partage contiennent uniquement les réglages. Pour les grands K, préférez le profil JSON afin d’éviter des URL trop longues.

Astuce : n’incluez pas de libellés confidentiels dans les profils partagés.

Comment utiliser cet outil

Utilisez cette page pour générer des vecteurs de probabilités qui restent non négatifs et dont la somme vaut 1.

Utilisation en 3 étapes

  1. Commencez avec une petite dimension, par exemple K=3, et un preset facile à lire.
  2. Générez l’échantillon puis examinez ensemble les moyennes théoriques, les marginales et l’aperçu des lignes.
  3. Changez une seule valeur de α ou seulement la concentration totale pour distinguer effet de moyenne et effet de concentration.

Comment lire le résultat

Chaque ligne est un vecteur de probabilités. Les moyennes indiquent la part attendue de chaque composante, tandis que la concentration contrôle à quel point les échantillons restent proches de cette moyenne. Comme tout doit sommer à 1, si une composante monte, les autres perdent de la place.

Points de vigilance aux limites

Questions fréquentes

Pourquoi les composantes sont-elles négativement corrélées ?
Comme toutes les composantes doivent sommer à 1, augmenter l’une d’elles tend à réduire au moins une autre.
Pourquoi les échantillons collent-ils aux coins ?
Si une ou plusieurs valeurs de α sont inférieures à 1, ou si la concentration totale est faible, la densité se déplace vers les bords du simplexe.
Pourquoi une ligne exportée peut-elle ne plus sommer exactement à 1 ?
L’arrondi peut casser l’égalité exacte alors que l’échantillon interne somme toujours à 1 avant export.
Quelle différence avec Beta ?
Dirichlet gère des vecteurs de probabilités, tandis que Beta est le cas particulier à deux composantes vu via une seule composante.
Que faire d’abord sur cette page ?
Commencez par un cas de base en faible dimension, puis changez seulement un α ou la concentration.