Apa itu distribusi Dirichlet?
Distribusi Dirichlet adalah distribusi untuk vektor probabilitas (x1,…,xK), dengan setiap komponen tidak negatif dan totalnya 1. Ruang ini disebut simpleks.
- α (alpha) dapat dibaca seperti pseudo-count. Ukuran relatif α menentukan vektor rata-rata.
- α0 = Σα_i adalah konsentrasi: semakin besar α0, sampel makin rapat di sekitar rata-rata.
- Jika beberapa α_i < 1, sampel cenderung jarang dan menempel pada sudut atau tepi.
- K=2 adalah kasus khusus:
x1 ~ Beta(α1,α2).
Contoh penggunaan: prior Bayesian untuk probabilitas kategori, proporsi topik, bobot campuran, dan data uji berbentuk probabilitas.
Preset
Pilih preset praktis, lalu ubah nilainya setelah diterapkan.
Tip: Untuk K besar, gunakan JSON profil agar URL tidak terlalu panjang.
Generator
Pilih parameterisasi, buat sampel, lalu periksa rata-rata, marginal, dan diagnostik.
Statistik per komponen
| Komponen | Mean teori | Mean sampel | Varians teori | Varians sampel |
|---|
Pratinjau sampel (20 pertama)
JSON profil (simpan/pulihkan pengaturan)
URL berbagi hanya memuat pengaturan. Untuk K besar, gunakan JSON profil agar mudah disimpan tanpa URL panjang.
Tip: Jangan sertakan label rahasia seperti nama pelanggan dalam profil yang dibagikan.
Cara memakai alat ini
Gunakan halaman ini untuk membuat vektor probabilitas yang tidak negatif dan jumlahnya 1.
Gunakan dalam 3 langkah
- Mulai dari dimensi kecil seperti
K=3dan preset yang mudah dibaca. - Buat sampel, lalu tinjau mean teori, marginal, dan pratinjau baris bersama-sama.
- Ubah satu nilai
αatau konsentrasi total setiap kali agar pergeseran mean tidak bercampur dengan perubahan konsentrasi.
Cara membaca hasil
Setiap baris adalah satu vektor probabilitas. Mean menunjukkan porsi harapan tiap komponen, sedangkan konsentrasi mengatur seberapa rapat sampel berada di sekitar mean.
Pemeriksaan batas
- Jika ada
α_i<1, sampel lebih sering berada dekat sudut atau tepi simpleks. - Ekspor yang dibulatkan dapat membuat jumlah baris tampak tidak persis 1.
- Saat
K=2, bandingkan dengan alat Beta karena itu kasus khusus yang sama.