# ইনফারেন্স ও এস্টিমেশন

ইনফারেন্স শব্দের অর্থ অনুমান । যখন স্যাম্পল থেকে পাওয়া তথ্য থেকে পপুলেশন প্যারামিটার পরিসংখ্যান পদ্ধতির মাধ্যমে অনুমান করা হয় তাকে স্ট্যাটিস্টিক্যাল ইনফারেন্স বলা হয়। উদাহরন স্বরূপ বলা যেতে পারে আপনি ২০০ জন বাস চালকদের মাসিক আয়ের স্যাম্পল ডেটা সংগ্রহ করলেন , এই ডেটা থেকে আপনি ২০০ জন চালকের মাসিক গড় আয় জানতে পারলেন। এখন আপনি এই ইনফরমেশনের উপর ভিত্তি করে জানতে চাচ্ছেন সারা বাংলাদেশের বাস চালকদের গড় আয় কেমন হবে , এটাই হচ্ছে ইনফারেন্স। স্যাম্পলের ইনফরমেশনের উপর ভিত্তি করে পপুলেশনের ইনফরমেশন অনুমান করার পদ্ধতি।&#x20;

> * স্যাম্পল থেকে পাওয়া তথ্যকে স্যাম্পল স্টাটিস্টিক (Statistic) বলা হয়। স্টাটিস্টিক কে ইংরেজি বর্ণ দ্বারা প্রকাশ করা হয় যেমন মিন-কে X , স্ট্যান্ডার্ড ডেভিয়েশন-কে S দ্বারা প্রকাশ করা হয়। &#x20;
> * পুপুলেশনের তথ্যকে পপুলেশন প্যারামিটার (Parameter) বলে। প্যারামিটারকে গ্রিক বর্ণ দ্বারা প্রকাশ করা হয় যেমন মিন-কে  **μ** এবং স্ট্যান্ডার্ড ডেভিয়েশন-কে σ দ্বারা প্রকাশ করা হয় ।

ইনফারেন্স দুই ধরনের হয়ে থাকে ,

* এস্টিমেশন&#x20;
* হাইপোথিসিস টেস্টিং

**এস্টিমেশন**

এস্টিমেশন হচ্ছে স্যাম্পলের তথ্য থেকে পপুলেশন প্যারামিটারের সংখ্যাগত তথ্য বের করার পদ্ধতি।&#x20;

* পপুলেশন প্যারামিটারে যে নিউম্যারিক্যাল ভ্যালু অ্যাসাইন করা হয় তাকে বলা হয় এস্টিমেট
* এস্টিমেশনের জন্য যে স্যাম্পল স্টাটিস্টিক ব্যবহার করা হয় তাকে বলা হয় এস্টিমেটর

এস্টিমেশন দুই ধরনের হয়ে থাকে,

* পয়েন্ট এস্টিমেশন&#x20;
* ইন্টারভ্যাল এস্টিমেশন

**পয়েন্ট এস্টিমেশন**&#x20;

পয়েন্ট এস্টিমেশনে পপুলেশন প্যারামিটারের একটি নির্দিষ্ট ভ্যালু বের করা হয়। এক্ষেত্রে স্যাম্পল ইনফরমেশনকেই পপুলেশন ইনফরমেশন হিসাবে মনে করা হয়।

পয়েন্ট এস্টিমেশনের পদ্ধতীসমূহ,

* **মেথড অব মোমেন্টস -** স্যাম্পল মোমেন্টসকে পপুলেশন মোমেন্টস এর সমান ধরা হয় এবং এভাবেই স্যাম্পল থেকে পপুলেশন প্যারামিটার এস্টিমেট করা হয়। ১ম মোমেন্টসকে মিন , ২য়  মোমেন্টসকে ভ্যারিয়্যান্স , ৩য় মোমেন্টসকে  স্কিউনেস এবং ৪রথ মোমেন্টসকে কার্টোসিস বলা হয়।
* **ম্যাক্সিমাম লাইকলিহুড মেথড-** ম্যাক্সিমাম লাইকলিহুড ফাংশন এবং প্রবাবিলিটি ডিস্ট্রিবিউশন মেকানিজম ব্যাবহার করে এই পদ্ধতিতে এস্টিমেশন করা হয়।

**ইন্টারভ্যাল এস্টিমেশন**&#x20;

পয়েন্ট এস্টিমেশনে কিছু এরর থাকবে ধরে নিয়ে একটি নির্দিষ্ট রেঞ্জ বা সীমার ভেতরে পপুলেশন প্যারামিটারের মান এস্টিমেট করাকে ইন্টারভ্যাল এস্টিমেশন বলা হয়। ইন্টারভ্যাল এস্টিমেশন একটি কনফিডেন্স লেভেলের সমন্বয়ে গঠিত যেমন ৯০% কনফিডেন্স লেভেল, ৯৫% কনফিডেন্স লেভেল, ৯৯ % কনফিডেন্স লেভেল ইত্যাদি।&#x20;

![](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M9i3rXd1vlHNvpHd49_%2F-M9i7pGaNmZP500ckaEL%2Fimage.png?alt=media\&token=b9490ae7-845f-4adc-99cc-d46ff87663fa)

ইন্টারভ্যাল এস্টিমেশন প্রধানত দুই ভাবে করা হয়। যখন পপুলেশন স্ট্যান্ডার্ড ডেভিয়শন σ জানা থাকে তখন  জেড  ডিস্ট্রিবিউশন অনুসরন করা  হয় এবং   σ অজানা থাকলে টি ডিস্ট্রিবিউশন অনুসরন করা হয় ।&#x20;

![](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M9i3rXd1vlHNvpHd49_%2F-M9iAOVPGCqidRriiwLB%2Fimage.png?alt=media\&token=f7363ce0-8007-4cfb-aefc-04cbc3da22a6)

উভয় ক্ষেত্রেই স্যাম্পল সাইজ ৩০ এর কম বা বেশী কিনা সেটি দেখা হয়। স্যাম্পল সাইজ যদি ৩০ এর বেশী হয় তাহলে সেটিকে লার্জ স্যাম্পল ধরা হয় , অপরদিকে স্যাম্পল সাইজ যদি ৩০ এর কম হয় তাহলে সেটিকে স্মল স্যাম্পল ধরা হয় , স্মল স্যাম্পলের ক্ষেত্রে জেড ডিস্ট্রিবিউশন বা টি ডিস্ট্রিবিউশনের শর্ত পূরন করতে হলে স্যাম্পল যে পপুলেশন থেকে নেয়া হয়েছে সেই পপুলেশনকে অবশ্যই নরমাল ডিস্ট্রিবিউশন অনুসরন করতে হবে।&#x20;

স্যাম্পল যদি ৩০ এর কম হয় এবং স্যাম্পল যে পপুলেশন থেকে নেয়া হয়েছে সেটি নরমাল ডিস্ট্রিবিউশন অনুসরন না করে সেক্ষেত্রে জেড ডিস্ট্রিবিউশন , টি ডিস্ট্রিবিউশন  বা অন্যান্য পদ্ধতি অনুসরন করা যাবে না । সেক্ষেত্রে আমাদের নন-প্যারামেট্রিক মেথড অনুসরন করতে হবে।&#x20;

&#x20;**σ যখন জানা**&#x20;

&#x20;পপুলেশনের স্ট্যান্ডার্ড ডেভিয়েশন যদি আমাদের জানা থাকে সেক্ষেত্রে আমরা নিম্নোক্ত পদ্ধতিতে ইন্টারভ্যাল এস্টিমেশন করি।

![](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M9i3rXd1vlHNvpHd49_%2F-M9iD4JIB86SWdbIex6e%2Fimage.png?alt=media\&token=64cbc001-bb14-45a7-97b9-548856c0fb0c)

![](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M9i3rXd1vlHNvpHd49_%2F-M9i5E7e5KPgdJuRLFGx%2Fimage.png?alt=media\&token=2e39a8ba-abe1-4d94-8d8e-8aa117554651)

**গানিতিক উদাহরন**

মনে করুন একজন গবেষক কোন একটি শহরের মিডিয়াম সাইজ এপার্টমেন্টের গড় দামের ইন্তারভ্যাল এস্টিমেট করতে চায়। এজন্য তিনি ১৫০০ টি এপার্টমেন্টেের বিক্রয় মূল্যের স্যাম্পল ডেটা সংগ্রহ করলেন। স্যাম্পল ডেটার এপার্টমেন্টেের গড় বিক্রয়মূল্য  ২৯৯৭২০ ডলার । পূর্বের গবেষণা থেকে জানা যায় ঐ শহরের সকল এপার্টমেন্টেে বিক্রয়মূল্যের (পপুলেশন) স্ট্যান্ডার্ড ডেভিয়েশন  ৬৮৬৫০ ডলার। তাহলে  ৯৫% কনফিডেন্স ইন্টারভ্যালে সমগ্র শহরের ক্ষেত্রে (পপুলেশন) এপার্টমেন্টেের গড় বিক্রয়মূল্যের ইন্টারভ্যাল কত হবে?&#x20;

![](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M9iS3wr1X9KNkplYBQM%2F-M9ia7_-lPQqY4j2UpWj%2Fimage.png?alt=media\&token=327e00b4-2fe9-4768-8ed0-293acacc7111)

&#x20;**σ যখন অজানা**&#x20;

পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন σ অজানা থাকলে আমরা নিচের পদ্ধতিতে ইন্টারভ্যাল এস্টিমেশন করি। নিচের সমীকরনে আমরা দেখতে পাচ্ছি স্যাম্পল মিন থেকে পপুলেশনের জন্য ইন্টারভ্যাল এস্টিমেট করার জন্য স্যাম্পলের স্ট্যান্ডার্ড ডেভিয়েশন ব্যাবহার করি, কারন আমাদের এক্ষেত্রে আমাদের পুপুলেশনের স্ট্যান্ডার্ড ডেভিয়েশন অজানা থাকে।  অজানা σ এর জন্য আমরা নির্দিষ্ট কনফিডেন্স লেভেলের জন্য t এর একটি মান গ্রহন করি এবং  এক্ষেত্রে ডিগ্রিস অব ফ্রিডম নামের আরেকটি বিষয় গননা করা হয়। সাধারনত স্যাম্পল সাইজ n এর মান থেকে 1 বিয়োগ করে ডিগ্রিস অব ফ্রিডম বের করা হয়।&#x20;

![](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M9i3rXd1vlHNvpHd49_%2F-M9iDN7KzF2U742K_nJV%2Fimage.png?alt=media\&token=0f934992-afeb-406a-8a23-5505ffd695e8)

**গানিতিক উদাহরন**

একজন চিকিৎসক কোন শহরের সকল প্রাপ্ত বয়স্ক পুরুষদের রক্তের কলেস্টোরেলের গড়ের ইন্টারভ্যাল মান জানতে চান। এজন্য তিনি ২৫  জনের স্যাম্পল নিলেন এবং স্যাম্পল থেকে কোলেস্টেরলের গড় মান পাওয়া গেল ১৮৬ mg/dL এবং স্যাম্পলের স্ট্যান্ডার্ড ডেভিয়েশন পাওয়া যায় 12 mg/dL । ধরে নেয়া হোল ঐ শহরের প্রাপ্ত বয়স্ক পুরুষদের রক্তের কলেস্টোরেল নরমাল ডিস্ট্রিবিউশন অনুসরন করে। ৯৫% কনফিডেন্স ইন্টারভ্যালে ঐ শহরের সমস্ত প্রাপ্ত বয়স্ক পুরুষদের রক্তের কোলেস্টেরলের গড়ের ইন্টারভ্যাল মান কত হবে ?

![](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-MBP_Q3b3R-TflBHVyzm%2F-MBPeBb4z6taZ7jy1ZVm%2Festimation-1%20\(1\).png?alt=media\&token=957b3c45-2721-4f7c-bfe6-9bb46085ea79)

**পপুলেশন প্রপশনের ইন্টারভ্যাল এস্টিমেশন**

বাস্তব জীবনে আমরা এমন ধরনের কিছু সমস্যা পাবো যেখানে পপুলেশনের অনুপাত বা প্রপশনের ইন্টারভ্যাল এস্টিমেট করতে হয়। উদাহরণ স্বরূপ বলা যায়, অনেক সময় আমরা দেখে থাকি কোন নির্বাচনের পূর্বে কিছু সার্ভে করা হয় এবং সেই সার্ভের ফলাফলের উপর ভিত্তি করে বলা হয় অমুক দল "এত থেকে এত " শতাংশ ভোট পেতে পারে অথবা  "এত থেকে এত " শতাংশ  মানুষ এই বিষয়ে একমত পোষণ করতে পারে।&#x20;

এধরনের ক্ষেত্রে আমরা নিম্নোক্ত পদ্ধতিতে স্যাম্পল প্রপশন থেকে পপুলেশন প্রপশন ইন্টারভ্যাল এস্টিমেট করে থাকি। &#x20;

![](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M9i3rXd1vlHNvpHd49_%2F-M9iH75_5bf-qr_vbF4_%2Fimage.png?alt=media\&token=913ea65e-a638-431b-849d-590c61200c9b)

**গানিতিক উদাহরণ**

২০০৯ সালে পিউ রিসার্চ সেন্টার ১৮ থেকে ২৯ বছর বয়সি ১০০০ মানুষকে স্যাম্পল হিসাবে বাছাই করে তাদের ভেতর একটি গবেষণা পরিচালনা করে। সেই গবেষণায় তাদের কাছে জানতে চাওয়া হয়েছিল " তাদের জীবনে ধর্মের কোন গুরুত্ব রয়েছে কিনা ? " । ৪৪% মানুষ জানায় তাদের জীবনে ধর্মের অবস্থান অত্যন্ত গুরুত্বপূর্ণ।&#x20;

উক্ত তথ্যের ভিত্তিতে ৯৯% কনফিডেন্স ইন্টারভ্যালে পপুলেশনের ক্ষেত্রে এই প্রপশন এস্টিমেট করুন ।

![](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M9i3rXd1vlHNvpHd49_%2F-M9iOoTYiHK4L2sltmc_%2Fimage.png?alt=media\&token=70738a1b-4c19-40e8-b499-505c760b774a)
