ตัวสำรวจ Sampling & Bootstrap — CLT (พร้อมขั้นตอน)

จำลองตัวอย่างแบบ uniform, normal, exponential และ Bernoulli ด้วย LCG ที่กำหนด seed คงที่ ตรวจดูค่าประมาณของสถิติ ช่วงความเชื่อมั่นแบบ percentile/t/normal และสำรวจฮิสโตแกรม CLT พร้อมคำอธิบายทีละขั้น.

ออกแบบมาสำหรับห้องเรียน: มีลิงก์แชร์ที่ทำซ้ำได้ ส่งออก CSV จองพื้นที่โฆษณา และมีความคิดเห็น Giscus พร้อมเครื่องมือความน่าจะเป็นและอนุมานที่เกี่ยวข้อง.

ภาษาอื่น ๆ: ja | en | es | zh-CN

Controls

Distribution & statistic
Exponential parameter
Seeds & CLT
95% confidence intervals

สรุปผลลัพธ์

ค่าประมาณจุด
ค่าเฉลี่ยของตัวอย่าง
มัธยฐานของตัวอย่าง
ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง
n / B
/
ค่าเฉลี่ยตามทฤษฎี / σ
/
  • Bootstrap percentile

  • ประมาณด้วย t (ค่าเฉลี่ย)

  • ประมาณด้วยปกติ (สัดส่วน)

วิธีคำนวณ

  1. ตั้งค่า LCG (a=1664525, c=1013904223, m=232) ด้วย seed เพื่อให้ลำดับการสุ่มตัวอย่างทำซ้ำได้.
  2. สุ่มตัวอย่าง n= ค่า จากแจกแจง และคำนวณสถิติ ที่เลือก.
  3. สุ่มซ้ำแบบ bootstrap จำนวน B= ครั้ง ใช้ควอนไทล์ชนิด Type-1 และรายงานช่วงความเชื่อมั่นที่เลือก ().
  4. สำหรับตัวสำรวจ CLT ใช้ seed กับค่าเฉลี่ยของตัวอย่างที่แปลงมาตรฐานแล้ว K= ค่า และสรุปเป็นค่าเฉลี่ย/ความแปรปรวน ≈ .

ทั้งลิงก์ที่แชร์และไฟล์ CSV จะบันทึก seed และการตั้งค่าทั้งหมดไว้ เพื่อให้การสาธิตทำซ้ำได้.

ฮิสโตแกรม

แจกแจงของ Bootstrap

แสดงแจกแจงของค่าสถิติจากการสุ่มซ้ำ bootstrap และไฮไลต์ช่วงความเชื่อมั่น.

ค่าเฉลี่ยที่แปลงมาตรฐานสำหรับ CLT

เมื่อวางทับกับ N(0,1) จะเห็นได้ว่าค่าเฉลี่ยและความแปรปรวนเชิงประจักษ์เข้าใกล้ 0 และ 1 ตามลำดับเร็วเพียงใด.

คำถามที่พบบ่อย

ทำไมจึงใช้ bootstrap percentile ชนิด Type-1?

เพราะใช้สถิติลำดับ floor((B−1)p) ทำให้ปลายช่วงความเชื่อมั่นอ่านง่าย และสอดคล้องกับคำอธิบาย bootstrap ในตำราเรียน.

LCG ที่กำหนดพารามิเตอร์ตายตัวมีข้อดีอย่างไร?

การใช้พารามิเตอร์เดียวกับโปรแกรมจำลองความน่าจะเป็นของเรา (a=1664525, c=1013904223, m=232) ทำให้เมื่อกำหนด seed เดียวกันจะได้ชุดตัวอย่างเหมือนกัน เหมาะกับการใช้ในแผนการสอน เอกสารประกอบ และการตรวจสอบจากระยะไกล.