การแจกแจงดิริชเลต์คืออะไร?
การแจกแจงดิริชเลต์สร้างเวกเตอร์ความน่าจะเป็นที่แต่ละองค์ประกอบไม่ติดลบและผลรวมเท่ากับ 1 พื้นที่นี้เรียกว่า simplex
ใช้ได้กับ prior แบบเบย์สำหรับความน่าจะเป็นเชิงหมวดหมู่ สัดส่วนหัวข้อ น้ำหนักผสม และข้อมูลทดสอบแบบความน่าจะเป็น โดยไม่ต้องใส่ข้อมูลส่วนบุคคล
- α_i ตีความได้คล้าย pseudo-count ขนาดสัมพัทธ์กำหนดเวกเตอร์ค่าเฉลี่ย
- α0 = Σα_i คือความเข้มข้น ยิ่งสูง ตัวอย่างยิ่งกระจุกใกล้ค่าเฉลี่ย
- α_i<1 ทำให้ตัวอย่างเกาะใกล้มุมหรือขอบง่ายขึ้น
- K=2 เป็นกรณีพิเศษที่สอดคล้องกับการแจกแจงเบตา
ค่าตั้งต้น
เลือกค่าตั้งต้นที่ใช้บ่อย แล้วปรับค่าเพิ่มเติมได้หลังจากนำไปใช้
เคล็ดลับ: เมื่อ K มีค่ามาก ให้ใช้โปรไฟล์ JSON สำหรับแชร์แทน URL ที่ยาว
ตัวสร้าง
เลือกวิธีตั้งพารามิเตอร์ สร้างตัวอย่าง แล้วตรวจค่าเฉลี่ย marginal distribution และค่าตรวจสอบ
สถิติรายองค์ประกอบ
| องค์ประกอบ | ค่าเฉลี่ยทฤษฎี | ค่าเฉลี่ยตัวอย่าง | ความแปรปรวนทฤษฎี | ความแปรปรวนตัวอย่าง |
|---|
ตัวอย่างแสดงผล (20 แถวแรก)
โปรไฟล์ JSON (บันทึก/กู้คืนการตั้งค่า)
URL แชร์มีเฉพาะการตั้งค่า หาก K มีค่ามาก ให้บันทึกและกู้คืนด้วยโปรไฟล์ JSON แทน URL ที่ยาว
เคล็ดลับ: อย่าใส่ป้ายกำกับที่ละเอียดอ่อน เช่น ชื่อลูกค้า ลงในโปรไฟล์ที่แชร์
วิธีใช้เครื่องมือนี้
ใช้เมื่อคุณต้องการเวกเตอร์ความน่าจะเป็นที่ทุกค่ามีค่าอย่างน้อย 0 และผลรวมเท่ากับ 1
ใช้ใน 3 ขั้นตอน
- เริ่มจากมิติต่ำ เช่น
K=3และ preset ที่ตีความง่าย - สร้างตัวอย่าง แล้วดูค่าเฉลี่ยทางทฤษฎี marginal distribution และตารางตัวอย่างร่วมกัน
- ถ้าต้องการแยกผลของค่าเฉลี่ยกับความเข้มข้น ให้ปรับค่า
αเพียงตัวเดียวหรือปรับเฉพาะความเข้มข้นรวม
อ่านผลลัพธ์
แต่ละแถวคือเวกเตอร์ความน่าจะเป็น ค่าเฉลี่ยแสดงสัดส่วนคาดหวังของแต่ละองค์ประกอบ ส่วนความเข้มข้นควบคุมว่าตัวอย่างกระจุกใกล้ค่าเฉลี่ยมากแค่ไหน
ตรวจขอบ
α_i<1ทำให้มวลใกล้มุมหรือขอบของ simplex เพิ่มขึ้น- ค่าที่ส่งออกหลังปัดเศษอาจดูเหมือนผลรวมคลาดจาก 1 เล็กน้อย
- ถ้า
K=2ให้เปรียบเทียบกับเครื่องมือเบตา ซึ่งเป็นกรณีพิเศษที่สอดคล้องกัน