什麼是 Dirichlet 分佈?
Dirichlet 分佈會產生非負且總和為 1 的向量,常用於比例、分類機率與主題比例。
α_i控制每個成分的期望大小。- 總集中度越大,樣本越靠近平均向量。
α_i<1時,樣本更容易靠近角落或邊界。K=2時,它與 Beta 分佈相連。
使用此工具不需要輸入個人資料。若要分享設定,請避免在標籤中放入敏感資料。
預設
選擇常用形狀作為起點,套用後仍可調整數值。
提示:K 很大時,建議用設定檔 JSON 分享,而不是使用很長的 URL。
產生器
選擇參數方式並產生樣本後,查看平均、邊際分佈與診斷值。
各成分統計
| 成分 | 理論平均 | 樣本 平均 | 理論變異數 | 樣本 變異數 |
|---|
樣本預覽(前 20 筆)
設定檔 JSON(儲存/還原設定)
分享 URL 只包含設定。K 很大時,請改用設定檔 JSON 儲存與還原,避免 URL 過長。
提示:分享設定檔時,請不要放入客戶名稱等敏感標籤。
使用方式
用來產生每個成分非負、且總和必須為 1 的機率向量。
3 步驟使用
- 先用
K=3這類低維度設定與容易解讀的預設開始。 - 產生樣本後,一起查看理論平均、邊際分佈與列預覽。
- 若要分開觀察平均移動與集中度變化,一次只改一個
α值或總集中度。
如何解讀結果
每一列都是一個機率向量。平均顯示各成分的期望比例,集中度控制樣本靠近該平均的程度。
邊界檢查
α_i<1時,simplex 角落或邊界附近的質量會增加。- 四捨五入後的匯出值,顯示上總和可能看起來略偏離 1。
K=2時,可和對應特例 Beta 工具比較。
常見問題
為什麼成分之間會呈現負相關?
因為所有成分總和必須為 1,一個成分變大時,至少另一個成分通常會變小。
為什麼樣本會貼近角落?
若一個以上的 α 值小於 1,或總集中度很小,密度會往 simplex 邊界移動。
為什麼匯出的列看起來不完全加總為 1?
四捨五入後的輸出可能看起來不再精確加總為 1,但內部未四捨五入的樣本仍然加總為 1。
和 Beta 分佈有什麼不同?
Dirichlet 處理機率向量;Beta 是二成分特例從其中一個成分來看的分佈。
一開始先看什麼比較好?
先從低維度基準值開始,再一次只調整一個 α 值或集中度設定。