מחולל הפצת דיריכלה & ויזואלייזר

Q: מדוע הרכיבים מתואם שלילי?

מכיוון שכל הרכיבים חייבים לסכם ל-1, הגדלת רכיב אחד נוטה להקטין לפחות רכיב נוסף אחד.

Q: למה דגימות נדבקות לפינות?

אם ערכי α אחד או יותר מתחת ל-1, או הריכוז הכולל קטן, הצפיפות נעה לעבר גבולות הסימפלקס.

Q: למה השורה המיוצאת יכולה להפסיק לסכם בדיוק ל-1?

פלט מעוגל עלול לאבד שוויון מדויק אף על פי שהמדגם הבסיסי עדיין מסכם ל-1 לפני העיגול.

Q: איך זה שונה מ-Beta?

דיריכלה מטפל בווקטורים של הסתברויות, בעוד שבטא הוא מקרה מיוחד דו-רכיבי הנצפה דרך רכיב אחד.

Q: איזה בסיס כדאי לי לנסות קודם?

התחל עם וקטור מממד נמוך כמו K=3, ואז משנה ערך α אחד או הריכוז הכולל כך שההזזות הממוצעות ושינויים בריכוז יישארו נפרדים.

מהי הפצת דיריכלה?

A התפלגות דיריכלה היא התפלגות מעל וקטורי הסתברות (x1,…,xK) כאשר כל רכיב אינו שלילי והסכומים הכולל הוא 1. מרחב זה נקרא simplex.

α (אלפא) ניתן לפרש כך פסאודו-קאונטרים. הגדלים היחסיים של α קובעים את וקטור ממוצע.
α0 = Σα_i הוא ה- concentration (חוזק): α0 גדול יותר ⇒ צמוד יותר סביב הממוצע; α0 קטן יותר ⇒ יותר שונות.
אם יש α_i < 1, הדגימות נוטות להיות sparse ונדבקות לפינות/קצוות; אם כולן α_i > 1, מסה נמצאת לעיתים קרובות בתוך הסימפלקס.
K=2 הוא מקרה מיוחד: x1 ~ Beta(α1,α2) (כלי זה מציג את שכבת הבטא ומקשר לכלי הבטא).

מקרים נפוצים: פריורים בייסיאניים להסתברויות קטגוריות, פרופורציות נושא, משקלי תערובת ונתוני מבחן דמויי הסתברות. אין צורך להזין מידע אישי כדי להשתמש בו.

Presets

בחר פריסט פרקטי (הוא מתחדש מיד; אפשר לכוונן אחרי ההחלה).

טיפ: עבור K גדול, השתמש בפרופיל JSON לשיתוף במקום כתובות URL ארוכות.

Generator

בחר פרמטריזציה, יצר דגימות, ואז בדוק ממוצעים, שוליים ואבחון.

Parameterization

מימד (K) תוויות (מופרדות בפסיק)

α (אותו דבר לכל הרכיבים)

כל הרכיבים משתמשים ב-α_i = α. נקודת התחלה טובה לראות "פינה מול מרכז".

ריכוז (α0)

הכירו וקטור ממוצע m (סכומים ל-1). כלי זה נגזר α = m×α0.

Component	בינוני (m_i)

כל ערכי α חייבים להיות >0. ערכים קטנים יותר (<1) מעודדים וקטורים דלילים וכבדים בפינה.

Component	α_i

גודל מדגם (N) פחים (היסטוגרמות)

RNG

רכיבי התצוגה (שוליים)

עד 5 רכיבים משמשים להיסטוגרמות שוליות. (עבור K גדול, רשימת תיבות הסימון מוסתרת — השתמש בקלט האינדקס.)

הצג מפת חום קורלציה (תיאוריה; רק K קטן)

עיגול תצוגה מקדימה (עשרוניות) עיגול ייצוא (אופציונלי) מצב JSON

פורמט העתק (תצוגה מקדימה)

סטטיסטיקות לכל רכיב

Component	ממוצע תיאורטי	מדגם ממוצע	תיאוריה ואר	ואר לדוגמה

תצוגה מקדימה לדוגמאות (ה-20 הראשונים)

פרופיל JSON (הגדרות שמירה/שחזור)

כתובות ה-URL לשיתוף כוללות רק הגדרות. עבור K גדול, השתמש בפרופיל JSON לשמירה/שחזור ללא כתובות URL ארוכות.

פרופיל ייבוא JSON

טיפ: אל תכלול תוויות סודיות (שמות לקוחות וכו') בפרופילים משותפים.

איך להשתמש בכלי זה

השתמש בדף זה כדי ליצור וקטורי הסתברות שחייבים להישאר לא שליליים ולסכום ל-1.

שימוש בשלושה שלבים

נתחיל עם מימד קטן כמו K=3 ופריסט שקל לפרש.
יצר את הדגימה, ואז סקר יחד ממוצעים תיאורטיים, שוליים ותצוגות שורות.
שינוי אחד α הערך או הריכוז הכולל בכל פעם, כדי שתוכל לבודד שינויים ממוצעים מהזזות ריכוז.

איך לקרוא את התוצאה

כל שורה היא וקטור הסתברות אחד. הממוצעים מראים את החלק הצפוי של כל רכיב, בעוד שהריכוז קובע עד כמה הדגימות נשארות קרובות לממוצע. מכיוון שכל הרכיבים חייבים לסכום ל-1, עליות ברכיב אחד מצמצמות מקום לאחרים.

בדיקות גבול

אם בכלל α_i<1, צפו למסה גבוהה יותר בקרבת פינות או קצוות סימפלקס.
ייצוא מעוגל יכול לגרום לשורה המוצגת להיראות מעט שונה מסכום מדויק של 1.
When K=2, השוו לכלי הבטא כי זהו מקרה מיוחד מתאים.

שאלות נפוצות

מדוע הרכיבים מתואם שלילי?