ইনফারেন্স ও এস্টিমেশন

“If you want to go fast, go alone. If you want to go far, go with others.”― African proverb

ইনফারেন্স শব্দের অর্থ অনুমান । যখন স্যাম্পল থেকে পাওয়া তথ্য থেকে পপুলেশন প্যারামিটার পরিসংখ্যান পদ্ধতির মাধ্যমে অনুমান করা হয় তাকে স্ট্যাটিস্টিক্যাল ইনফারেন্স বলা হয়। উদাহরন স্বরূপ বলা যেতে পারে আপনি ২০০ জন বাস চালকদের মাসিক আয়ের স্যাম্পল ডেটা সংগ্রহ করলেন , এই ডেটা থেকে আপনি ২০০ জন চালকের মাসিক গড় আয় জানতে পারলেন। এখন আপনি এই ইনফরমেশনের উপর ভিত্তি করে জানতে চাচ্ছেন সারা বাংলাদেশের বাস চালকদের গড় আয় কেমন হবে , এটাই হচ্ছে ইনফারেন্স। স্যাম্পলের ইনফরমেশনের উপর ভিত্তি করে পপুলেশনের ইনফরমেশন অনুমান করার পদ্ধতি।

স্যাম্পল থেকে পাওয়া তথ্যকে স্যাম্পল স্টাটিস্টিক (Statistic) বলা হয়। স্টাটিস্টিক কে ইংরেজি বর্ণ দ্বারা প্রকাশ করা হয় যেমন মিন-কে X , স্ট্যান্ডার্ড ডেভিয়েশন-কে S দ্বারা প্রকাশ করা হয়।
পুপুলেশনের তথ্যকে পপুলেশন প্যারামিটার (Parameter) বলে। প্যারামিটারকে গ্রিক বর্ণ দ্বারা প্রকাশ করা হয় যেমন মিন-কে μ এবং স্ট্যান্ডার্ড ডেভিয়েশন-কে σ দ্বারা প্রকাশ করা হয় ।

ইনফারেন্স দুই ধরনের হয়ে থাকে ,

এস্টিমেশন
হাইপোথিসিস টেস্টিং

এস্টিমেশন

এস্টিমেশন হচ্ছে স্যাম্পলের তথ্য থেকে পপুলেশন প্যারামিটারের সংখ্যাগত তথ্য বের করার পদ্ধতি।

পপুলেশন প্যারামিটারে যে নিউম্যারিক্যাল ভ্যালু অ্যাসাইন করা হয় তাকে বলা হয় এস্টিমেট
এস্টিমেশনের জন্য যে স্যাম্পল স্টাটিস্টিক ব্যবহার করা হয় তাকে বলা হয় এস্টিমেটর

এস্টিমেশন দুই ধরনের হয়ে থাকে,

পয়েন্ট এস্টিমেশন
ইন্টারভ্যাল এস্টিমেশন

পয়েন্ট এস্টিমেশন

পয়েন্ট এস্টিমেশনে পপুলেশন প্যারামিটারের একটি নির্দিষ্ট ভ্যালু বের করা হয়। এক্ষেত্রে স্যাম্পল ইনফরমেশনকেই পপুলেশন ইনফরমেশন হিসাবে মনে করা হয়।

পয়েন্ট এস্টিমেশনের পদ্ধতীসমূহ,

মেথড অব মোমেন্টস - স্যাম্পল মোমেন্টসকে পপুলেশন মোমেন্টস এর সমান ধরা হয় এবং এভাবেই স্যাম্পল থেকে পপুলেশন প্যারামিটার এস্টিমেট করা হয়। ১ম মোমেন্টসকে মিন , ২য় মোমেন্টসকে ভ্যারিয়্যান্স , ৩য় মোমেন্টসকে স্কিউনেস এবং ৪রথ মোমেন্টসকে কার্টোসিস বলা হয়।
ম্যাক্সিমাম লাইকলিহুড মেথড- ম্যাক্সিমাম লাইকলিহুড ফাংশন এবং প্রবাবিলিটি ডিস্ট্রিবিউশন মেকানিজম ব্যাবহার করে এই পদ্ধতিতে এস্টিমেশন করা হয়।

ইন্টারভ্যাল এস্টিমেশন

পয়েন্ট এস্টিমেশনে কিছু এরর থাকবে ধরে নিয়ে একটি নির্দিষ্ট রেঞ্জ বা সীমার ভেতরে পপুলেশন প্যারামিটারের মান এস্টিমেট করাকে ইন্টারভ্যাল এস্টিমেশন বলা হয়। ইন্টারভ্যাল এস্টিমেশন একটি কনফিডেন্স লেভেলের সমন্বয়ে গঠিত যেমন ৯০% কনফিডেন্স লেভেল, ৯৫% কনফিডেন্স লেভেল, ৯৯ % কনফিডেন্স লেভেল ইত্যাদি।

ইন্টারভ্যাল এস্টিমেশন প্রধানত দুই ভাবে করা হয়। যখন পপুলেশন স্ট্যান্ডার্ড ডেভিয়শন σ জানা থাকে তখন জেড ডিস্ট্রিবিউশন অনুসরন করা হয় এবং σ অজানা থাকলে টি ডিস্ট্রিবিউশন অনুসরন করা হয় ।

উভয় ক্ষেত্রেই স্যাম্পল সাইজ ৩০ এর কম বা বেশী কিনা সেটি দেখা হয়। স্যাম্পল সাইজ যদি ৩০ এর বেশী হয় তাহলে সেটিকে লার্জ স্যাম্পল ধরা হয় , অপরদিকে স্যাম্পল সাইজ যদি ৩০ এর কম হয় তাহলে সেটিকে স্মল স্যাম্পল ধরা হয় , স্মল স্যাম্পলের ক্ষেত্রে জেড ডিস্ট্রিবিউশন বা টি ডিস্ট্রিবিউশনের শর্ত পূরন করতে হলে স্যাম্পল যে পপুলেশন থেকে নেয়া হয়েছে সেই পপুলেশনকে অবশ্যই নরমাল ডিস্ট্রিবিউশন অনুসরন করতে হবে।

স্যাম্পল যদি ৩০ এর কম হয় এবং স্যাম্পল যে পপুলেশন থেকে নেয়া হয়েছে সেটি নরমাল ডিস্ট্রিবিউশন অনুসরন না করে সেক্ষেত্রে জেড ডিস্ট্রিবিউশন , টি ডিস্ট্রিবিউশন বা অন্যান্য পদ্ধতি অনুসরন করা যাবে না । সেক্ষেত্রে আমাদের নন-প্যারামেট্রিক মেথড অনুসরন করতে হবে।

σ যখন জানা

পপুলেশনের স্ট্যান্ডার্ড ডেভিয়েশন যদি আমাদের জানা থাকে সেক্ষেত্রে আমরা নিম্নোক্ত পদ্ধতিতে ইন্টারভ্যাল এস্টিমেশন করি।

গানিতিক উদাহরন

মনে করুন একজন গবেষক কোন একটি শহরের মিডিয়াম সাইজ এপার্টমেন্টের গড় দামের ইন্তারভ্যাল এস্টিমেট করতে চায়। এজন্য তিনি ১৫০০ টি এপার্টমেন্টেের বিক্রয় মূল্যের স্যাম্পল ডেটা সংগ্রহ করলেন। স্যাম্পল ডেটার এপার্টমেন্টেের গড় বিক্রয়মূল্য ২৯৯৭২০ ডলার । পূর্বের গবেষণা থেকে জানা যায় ঐ শহরের সকল এপার্টমেন্টেে বিক্রয়মূল্যের (পপুলেশন) স্ট্যান্ডার্ড ডেভিয়েশন ৬৮৬৫০ ডলার। তাহলে ৯৫% কনফিডেন্স ইন্টারভ্যালে সমগ্র শহরের ক্ষেত্রে (পপুলেশন) এপার্টমেন্টেের গড় বিক্রয়মূল্যের ইন্টারভ্যাল কত হবে?

σ যখন অজানা

পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন σ অজানা থাকলে আমরা নিচের পদ্ধতিতে ইন্টারভ্যাল এস্টিমেশন করি। নিচের সমীকরনে আমরা দেখতে পাচ্ছি স্যাম্পল মিন থেকে পপুলেশনের জন্য ইন্টারভ্যাল এস্টিমেট করার জন্য স্যাম্পলের স্ট্যান্ডার্ড ডেভিয়েশন ব্যাবহার করি, কারন আমাদের এক্ষেত্রে আমাদের পুপুলেশনের স্ট্যান্ডার্ড ডেভিয়েশন অজানা থাকে। অজানা σ এর জন্য আমরা নির্দিষ্ট কনফিডেন্স লেভেলের জন্য t এর একটি মান গ্রহন করি এবং এক্ষেত্রে ডিগ্রিস অব ফ্রিডম নামের আরেকটি বিষয় গননা করা হয়। সাধারনত স্যাম্পল সাইজ n এর মান থেকে 1 বিয়োগ করে ডিগ্রিস অব ফ্রিডম বের করা হয়।

গানিতিক উদাহরন

একজন চিকিৎসক কোন শহরের সকল প্রাপ্ত বয়স্ক পুরুষদের রক্তের কলেস্টোরেলের গড়ের ইন্টারভ্যাল মান জানতে চান। এজন্য তিনি ২৫ জনের স্যাম্পল নিলেন এবং স্যাম্পল থেকে কোলেস্টেরলের গড় মান পাওয়া গেল ১৮৬ mg/dL এবং স্যাম্পলের স্ট্যান্ডার্ড ডেভিয়েশন পাওয়া যায় 12 mg/dL । ধরে নেয়া হোল ঐ শহরের প্রাপ্ত বয়স্ক পুরুষদের রক্তের কলেস্টোরেল নরমাল ডিস্ট্রিবিউশন অনুসরন করে। ৯৫% কনফিডেন্স ইন্টারভ্যালে ঐ শহরের সমস্ত প্রাপ্ত বয়স্ক পুরুষদের রক্তের কোলেস্টেরলের গড়ের ইন্টারভ্যাল মান কত হবে ?

পপুলেশন প্রপশনের ইন্টারভ্যাল এস্টিমেশন

বাস্তব জীবনে আমরা এমন ধরনের কিছু সমস্যা পাবো যেখানে পপুলেশনের অনুপাত বা প্রপশনের ইন্টারভ্যাল এস্টিমেট করতে হয়। উদাহরণ স্বরূপ বলা যায়, অনেক সময় আমরা দেখে থাকি কোন নির্বাচনের পূর্বে কিছু সার্ভে করা হয় এবং সেই সার্ভের ফলাফলের উপর ভিত্তি করে বলা হয় অমুক দল "এত থেকে এত " শতাংশ ভোট পেতে পারে অথবা "এত থেকে এত " শতাংশ মানুষ এই বিষয়ে একমত পোষণ করতে পারে।

এধরনের ক্ষেত্রে আমরা নিম্নোক্ত পদ্ধতিতে স্যাম্পল প্রপশন থেকে পপুলেশন প্রপশন ইন্টারভ্যাল এস্টিমেট করে থাকি।

গানিতিক উদাহরণ

২০০৯ সালে পিউ রিসার্চ সেন্টার ১৮ থেকে ২৯ বছর বয়সি ১০০০ মানুষকে স্যাম্পল হিসাবে বাছাই করে তাদের ভেতর একটি গবেষণা পরিচালনা করে। সেই গবেষণায় তাদের কাছে জানতে চাওয়া হয়েছিল " তাদের জীবনে ধর্মের কোন গুরুত্ব রয়েছে কিনা ? " । ৪৪% মানুষ জানায় তাদের জীবনে ধর্মের অবস্থান অত্যন্ত গুরুত্বপূর্ণ।

উক্ত তথ্যের ভিত্তিতে ৯৯% কনফিডেন্স ইন্টারভ্যালে পপুলেশনের ক্ষেত্রে এই প্রপশন এস্টিমেট করুন ।

Previousপরিসংখ্যান ল্যাব-১ঃ বেসিক পরিসংখ্যান Nextহাইপোথিসিস টেস্টিং

Last updated 5 years ago

Was this helpful?