Qu’est-ce qu’une distribution de Dirichlet ?
La distribution de Dirichlet est une loi définie sur des vecteurs de probabilités (x1,…,xK) où chaque composante est positive ou nulle et où la somme vaut 1. Cet espace est appelé simplexe.
- α (alpha) peut se lire comme un ensemble de pseudo-comptages. Les rapports entre les α déterminent la moyenne théorique.
- α0 = Σα_i mesure la concentration : plus α0 est grand, plus les échantillons restent proches de la moyenne ; plus α0 est petit, plus ils varient.
- Si certains α_i < 1, les échantillons deviennent souvent creux et collent aux coins ou aux arêtes du simplexe.
- K=2 est un cas particulier : on retrouve la loi bêta sur une probabilité unique.
Cas d’usage fréquents : priors bayésiens pour des probabilités catégorielles, parts de sujets, poids de mélange ou données de test de type probabilité.
Préréglages
Choisissez un préréglage utile ; il régénère aussitôt et vous pouvez ensuite affiner les valeurs.
Astuce : pour les grands K, utilisez le profil JSON plutôt qu’une URL très longue.
Générateur
Choisissez une paramétrisation, générez des échantillons, puis examinez les moyennes, les marginales et les diagnostics.
Statistiques par composante
| Composante | Moyenne théorique | Moyenne observée | Variance théorique | Variance observée |
|---|
Aperçu des échantillons (20 premiers)
Profil JSON (enregistrer ou restaurer les réglages)
Les URL de partage contiennent uniquement les réglages. Pour les grands K, préférez le profil JSON afin d’éviter des URL trop longues.
Astuce : n’incluez pas de libellés confidentiels dans les profils partagés.
Comment utiliser cet outil
Utilisez cette page pour générer des vecteurs de probabilités qui restent non négatifs et dont la somme vaut 1.
Utilisation en 3 étapes
- Commencez avec une petite dimension, par exemple
K=3, et un preset facile à lire. - Générez l’échantillon puis examinez ensemble les moyennes théoriques, les marginales et l’aperçu des lignes.
- Changez une seule valeur de
αou seulement la concentration totale pour distinguer effet de moyenne et effet de concentration.
Comment lire le résultat
Chaque ligne est un vecteur de probabilités. Les moyennes indiquent la part attendue de chaque composante, tandis que la concentration contrôle à quel point les échantillons restent proches de cette moyenne. Comme tout doit sommer à 1, si une composante monte, les autres perdent de la place.
Points de vigilance aux limites
- Si un
α_i<1, attendez-vous à davantage de masse près des coins et des arêtes du simplexe. - Les exports arrondis peuvent faire apparaître une ligne qui ne somme plus exactement à 1.
- Avec
K=2, comparez avec l’outil Beta car c’est le cas spécial correspondant.
Questions fréquentes
Pourquoi les composantes sont-elles négativement corrélées ?
Pourquoi les échantillons collent-ils aux coins ?
Pourquoi une ligne exportée peut-elle ne plus sommer exactement à 1 ?
Quelle différence avec Beta ?
Que faire d’abord sur cette page ?
Outils associés
- Hub des distributionsParcourez les générateurs de lois et les diagnostics d’aléatoire.
- Échantillonneur de distributionsÉchantillonnez rapidement plusieurs lois usuelles dans un seul outil.
- Générateur de distribution bêtaQuand K=2, la loi de Dirichlet se ramène à la loi bêta.
- Générateur de JSON aléatoireCréez des objets de test qui ressemblent à des vecteurs de probabilités.
- Tests d’aléatoireAjoutez un contrôle rapide de la qualité de l’aléatoire.
- Guide Probabilité et simulationApprofondissez les liens entre distributions et simulation.