מהי הפצת דיריכלה?
A התפלגות דיריכלה היא התפלגות מעל וקטורי הסתברות (x1,…,xK) כאשר כל רכיב אינו שלילי והסכומים הכולל הוא 1. מרחב זה נקרא simplex.
- α (אלפא) ניתן לפרש כך פסאודו-קאונטרים. הגדלים היחסיים של α קובעים את וקטור ממוצע.
- α0 = Σα_i הוא ה- concentration (חוזק): α0 גדול יותר ⇒ צמוד יותר סביב הממוצע; α0 קטן יותר ⇒ יותר שונות.
- אם יש α_i < 1, הדגימות נוטות להיות sparse ונדבקות לפינות/קצוות; אם כולן α_i > 1, מסה נמצאת לעיתים קרובות בתוך הסימפלקס.
- K=2 הוא מקרה מיוחד:
x1 ~ Beta(α1,α2)(כלי זה מציג את שכבת הבטא ומקשר לכלי הבטא).
מקרים נפוצים: פריורים בייסיאניים להסתברויות קטגוריות, פרופורציות נושא, משקלי תערובת ונתוני מבחן דמויי הסתברות. אין צורך להזין מידע אישי כדי להשתמש בו.
Presets
בחר פריסט פרקטי (הוא מתחדש מיד; אפשר לכוונן אחרי ההחלה).
טיפ: עבור K גדול, השתמש בפרופיל JSON לשיתוף במקום כתובות URL ארוכות.
Generator
בחר פרמטריזציה, יצר דגימות, ואז בדוק ממוצעים, שוליים ואבחון.
סטטיסטיקות לכל רכיב
| Component | ממוצע תיאורטי | מדגם ממוצע | תיאוריה ואר | ואר לדוגמה |
|---|
תצוגה מקדימה לדוגמאות (ה-20 הראשונים)
פרופיל JSON (הגדרות שמירה/שחזור)
כתובות ה-URL לשיתוף כוללות רק הגדרות. עבור K גדול, השתמש בפרופיל JSON לשמירה/שחזור ללא כתובות URL ארוכות.
טיפ: אל תכלול תוויות סודיות (שמות לקוחות וכו') בפרופילים משותפים.
איך להשתמש בכלי זה
השתמש בדף זה כדי ליצור וקטורי הסתברות שחייבים להישאר לא שליליים ולסכום ל-1.
שימוש בשלושה שלבים
- נתחיל עם מימד קטן כמו
K=3ופריסט שקל לפרש. - יצר את הדגימה, ואז סקר יחד ממוצעים תיאורטיים, שוליים ותצוגות שורות.
- שינוי אחד
αהערך או הריכוז הכולל בכל פעם, כדי שתוכל לבודד שינויים ממוצעים מהזזות ריכוז.
איך לקרוא את התוצאה
כל שורה היא וקטור הסתברות אחד. הממוצעים מראים את החלק הצפוי של כל רכיב, בעוד שהריכוז קובע עד כמה הדגימות נשארות קרובות לממוצע. מכיוון שכל הרכיבים חייבים לסכום ל-1, עליות ברכיב אחד מצמצמות מקום לאחרים.
בדיקות גבול
- אם בכלל
α_i<1, צפו למסה גבוהה יותר בקרבת פינות או קצוות סימפלקס. - ייצוא מעוגל יכול לגרום לשורה המוצגת להיראות מעט שונה מסכום מדויק של 1.
- When
K=2, השוו לכלי הבטא כי זהו מקרה מיוחד מתאים.