Générateur et visualiseur de distribution de Dirichlet

Qu’est-ce qu’une distribution de Dirichlet ?

La distribution de Dirichlet est une loi définie sur des vecteurs de probabilités (x1,…,xK) où chaque composante est positive ou nulle et où la somme vaut 1. Cet espace est appelé simplexe.

α (alpha) peut se lire comme un ensemble de pseudo-comptages. Les rapports entre les α déterminent la moyenne théorique.
α0 = Σα_i mesure la concentration : plus α0 est grand, plus les échantillons restent proches de la moyenne ; plus α0 est petit, plus ils varient.
Si certains α_i < 1, les échantillons deviennent souvent creux et collent aux coins ou aux arêtes du simplexe.
K=2 est un cas particulier : on retrouve la loi bêta sur une probabilité unique.

Cas d’usage fréquents : priors bayésiens pour des probabilités catégorielles, parts de sujets, poids de mélange ou données de test de type probabilité.

Préréglages

Choisissez un préréglage utile ; il régénère aussitôt et vous pouvez ensuite affiner les valeurs.

Astuce : pour les grands K, utilisez le profil JSON plutôt qu’une URL très longue.

Générateur

Choisissez une paramétrisation, générez des échantillons, puis examinez les moyennes, les marginales et les diagnostics.

Paramétrisation

Dimension (K) Libellés (séparés par des virgules)

α (identique pour toutes les composantes)

Toutes les composantes utilisent α_i = α. C’est un bon point de départ pour voir l’effet “coins contre centre”.

Concentration (α0)

Saisissez un vecteur moyen m (somme = 1). L’outil en déduit α = m×α0.

Composante	Moyenne (m_i)

Toutes les valeurs α doivent être strictement positives. Des valeurs plus petites que 1 favorisent des vecteurs clairsemés, proches des coins.

Composante	α_i

Taille d’échantillon (N) Classes (histogrammes)

Mode aléatoire

Composantes à afficher (marginales)

Jusqu’à 5 composantes sont utilisées pour les histogrammes marginaux. Pour les grands K, utilisez le champ d’indices.

Afficher la carte de chaleur des corrélations (théorie, petits K seulement)

Arrondi d’aperçu (décimales) Arrondi à l’export (optionnel) Mode JSON

Format de copie (aperçu)

Statistiques par composante

Composante	Moyenne théorique	Moyenne observée	Variance théorique	Variance observée

Aperçu des échantillons (20 premiers)

Profil JSON (enregistrer ou restaurer les réglages)

Les URL de partage contiennent uniquement les réglages. Pour les grands K, préférez le profil JSON afin d’éviter des URL trop longues.

Importer un profil JSON

Astuce : n’incluez pas de libellés confidentiels dans les profils partagés.

Comment utiliser cet outil

Utilisez cette page pour générer des vecteurs de probabilités qui restent non négatifs et dont la somme vaut 1.

Utilisation en 3 étapes

Commencez avec une petite dimension, par exemple K=3, et un preset facile à lire.
Générez l’échantillon puis examinez ensemble les moyennes théoriques, les marginales et l’aperçu des lignes.
Changez une seule valeur de α ou seulement la concentration totale pour distinguer effet de moyenne et effet de concentration.

Comment lire le résultat

Chaque ligne est un vecteur de probabilités. Les moyennes indiquent la part attendue de chaque composante, tandis que la concentration contrôle à quel point les échantillons restent proches de cette moyenne. Comme tout doit sommer à 1, si une composante monte, les autres perdent de la place.

Points de vigilance aux limites

Si un α_i<1, attendez-vous à davantage de masse près des coins et des arêtes du simplexe.
Les exports arrondis peuvent faire apparaître une ligne qui ne somme plus exactement à 1.
Avec K=2, comparez avec l’outil Beta car c’est le cas spécial correspondant.

Questions fréquentes

Pourquoi les composantes sont-elles négativement corrélées ?

Comme toutes les composantes doivent sommer à 1, augmenter l’une d’elles tend à réduire au moins une autre.

Pourquoi les échantillons collent-ils aux coins ?

Si une ou plusieurs valeurs de α sont inférieures à 1, ou si la concentration totale est faible, la densité se déplace vers les bords du simplexe.

Pourquoi une ligne exportée peut-elle ne plus sommer exactement à 1 ?

L’arrondi peut casser l’égalité exacte alors que l’échantillon interne somme toujours à 1 avant export.

Quelle différence avec Beta ?

Dirichlet gère des vecteurs de probabilités, tandis que Beta est le cas particulier à deux composantes vu via une seule composante.

Que faire d’abord sur cette page ?

Commencez par un cas de base en faible dimension, puis changez seulement un α ou la concentration.

Hub des distributions
Parcourez les générateurs de lois et les diagnostics d’aléatoire.
Échantillonneur de distributions
Échantillonnez rapidement plusieurs lois usuelles dans un seul outil.
Générateur de distribution bêta
Quand K=2, la loi de Dirichlet se ramène à la loi bêta.
Générateur de JSON aléatoire
Créez des objets de test qui ressemblent à des vecteurs de probabilités.
Tests d’aléatoire
Ajoutez un contrôle rapide de la qualité de l’aléatoire.
Guide Probabilité et simulation
Approfondissez les liens entre distributions et simulation.