Dirichlet বিতরণ কী?
Dirichlet বিতরণ হলো সম্ভাবনা ভেক্টর (x1,…,xK)-এর বিতরণ, যেখানে প্রতিটি উপাদান non-negative এবং মোট যোগফল 1। এই space-কে simplex বলা হয়।
- α (alpha) pseudo-count হিসেবে ভাবা যায়। α মানের relative size গড় ভেক্টর নির্ধারণ করে।
- α0 = Σα_i concentration: বড় α0 গড়-এর কাছে tight নমুনা দেয়; ছোট α0 বেশি spread দেয়।
- কিছু α_i < 1 হলে নমুনা sparse এবং corner/edge-এর কাছে হতে পারে।
- K=2 বিশেষ রূপ:
x1 ~ Beta(α1,α2)।
ব্যবহার: categorical সম্ভাবনা prior, topic proportion, mixture weight এবং সম্ভাবনা-like test data। ব্যক্তিগত তথ্য লাগে না।
প্রিসেট
ব্যবহারিক preset বেছে নিন। সঙ্গে সঙ্গে নতুন করে তৈরি হয়; পরে মান বদলাতে পারবেন।
টিপ: বড় K শেয়ার করতে দীর্ঘ URL-এর বদলে profile JSON ব্যবহার করুন।
জেনারেটর
প্যারামিটার ধরন বেছে নিন, নমুনা তৈরি করুন; গড়, marginal ও diagnostic দেখুন।
প্রতি উপাদানের পরিসংখ্যান
| উপাদান | তাত্ত্বিক গড় | নমুনা গড় | Theory var | নমুনা বিচরণ |
|---|
নমুনা preview (প্রথম 20)
Profile JSON (সেটিংস save/restore)
শেয়ার URL-এ শুধু setting থাকে। বড় K-এর জন্য দীর্ঘ URL-এর বদলে profile JSON ব্যবহার করুন।
টিপ: শেয়ার করা profile-এ গ্রাহকের নামের মতো গোপন label যোগ করবেন না।
এই টুল কীভাবে ব্যবহার করবেন
non-negative এবং মোট 1 হয় এমন সম্ভাবনা ভেক্টর তৈরি করতে এই পেজ ব্যবহার করুন।
৩ ধাপে ব্যবহার
K=3মতো ছোট মাত্রা এবং সহজ preset দিয়ে শুরু করুন।- নমুনা তৈরি করে তাত্ত্বিক গড়, marginal ও row preview একসঙ্গে দেখুন।
- গড় shift ও concentration effect আলাদা করতে একবারে একটি
αবা মোট concentration বদলান।
ফলাফল কীভাবে পড়বেন
প্রতিটি row একটি সম্ভাবনা ভেক্টর। গড় প্রতিটি উপাদানের expected অংশ দেখায়; concentration নমুনা গড়-এর কাছে কত tight থাকবে তা নির্ধারণ করে। সব উপাদানের যোগফল 1 হওয়ায় একটির বৃদ্ধি অন্যগুলোর জায়গা কমায়।
সীমা পরীক্ষা
- সব α positive হতে হবে।
- গড় ভেক্টর non-negative এবং যোগফল 1 হতে হবে।
- export rounding দৃশ্যমান row total-কে 1 থেকে সরাতে পারে; দরকার হলে বেশি digit রাখুন।