ইনফারেন্স ও এস্টিমেশন

“If you want to go fast, go alone. If you want to go far, go with others.”― African proverb

ইনফারেন্স শব্দের অর্থ অনুমান । যখন স্যাম্পল থেকে পাওয়া তথ্য থেকে পপুলেশন প্যারামিটার পরিসংখ্যান পদ্ধতির মাধ্যমে অনুমান করা হয় তাকে স্ট্যাটিস্টিক্যাল ইনফারেন্স বলা হয়। উদাহরন স্বরূপ বলা যেতে পারে আপনি ২০০ জন বাস চালকদের মাসিক আয়ের স্যাম্পল ডেটা সংগ্রহ করলেন , এই ডেটা থেকে আপনি ২০০ জন চালকের মাসিক গড় আয় জানতে পারলেন। এখন আপনি এই ইনফরমেশনের উপর ভিত্তি করে জানতে চাচ্ছেন সারা বাংলাদেশের বাস চালকদের গড় আয় কেমন হবে , এটাই হচ্ছে ইনফারেন্স। স্যাম্পলের ইনফরমেশনের উপর ভিত্তি করে পপুলেশনের ইনফরমেশন অনুমান করার পদ্ধতি।

  • স্যাম্পল থেকে পাওয়া তথ্যকে স্যাম্পল স্টাটিস্টিক (Statistic) বলা হয়। স্টাটিস্টিক কে ইংরেজি বর্ণ দ্বারা প্রকাশ করা হয় যেমন মিন-কে X , স্ট্যান্ডার্ড ডেভিয়েশন-কে S দ্বারা প্রকাশ করা হয়।

  • পুপুলেশনের তথ্যকে পপুলেশন প্যারামিটার (Parameter) বলে। প্যারামিটারকে গ্রিক বর্ণ দ্বারা প্রকাশ করা হয় যেমন মিন-কে μ এবং স্ট্যান্ডার্ড ডেভিয়েশন-কে σ দ্বারা প্রকাশ করা হয় ।

ইনফারেন্স দুই ধরনের হয়ে থাকে ,

  • এস্টিমেশন

  • হাইপোথিসিস টেস্টিং

এস্টিমেশন

এস্টিমেশন হচ্ছে স্যাম্পলের তথ্য থেকে পপুলেশন প্যারামিটারের সংখ্যাগত তথ্য বের করার পদ্ধতি।

  • পপুলেশন প্যারামিটারে যে নিউম্যারিক্যাল ভ্যালু অ্যাসাইন করা হয় তাকে বলা হয় এস্টিমেট

  • এস্টিমেশনের জন্য যে স্যাম্পল স্টাটিস্টিক ব্যবহার করা হয় তাকে বলা হয় এস্টিমেটর

এস্টিমেশন দুই ধরনের হয়ে থাকে,

  • পয়েন্ট এস্টিমেশন

  • ইন্টারভ্যাল এস্টিমেশন

পয়েন্ট এস্টিমেশন

পয়েন্ট এস্টিমেশনে পপুলেশন প্যারামিটারের একটি নির্দিষ্ট ভ্যালু বের করা হয়। এক্ষেত্রে স্যাম্পল ইনফরমেশনকেই পপুলেশন ইনফরমেশন হিসাবে মনে করা হয়।

পয়েন্ট এস্টিমেশনের পদ্ধতীসমূহ,

  • মেথড অব মোমেন্টস - স্যাম্পল মোমেন্টসকে পপুলেশন মোমেন্টস এর সমান ধরা হয় এবং এভাবেই স্যাম্পল থেকে পপুলেশন প্যারামিটার এস্টিমেট করা হয়। ১ম মোমেন্টসকে মিন , ২য় মোমেন্টসকে ভ্যারিয়্যান্স , ৩য় মোমেন্টসকে স্কিউনেস এবং ৪রথ মোমেন্টসকে কার্টোসিস বলা হয়।

  • ম্যাক্সিমাম লাইকলিহুড মেথড- ম্যাক্সিমাম লাইকলিহুড ফাংশন এবং প্রবাবিলিটি ডিস্ট্রিবিউশন মেকানিজম ব্যাবহার করে এই পদ্ধতিতে এস্টিমেশন করা হয়।

ইন্টারভ্যাল এস্টিমেশন

পয়েন্ট এস্টিমেশনে কিছু এরর থাকবে ধরে নিয়ে একটি নির্দিষ্ট রেঞ্জ বা সীমার ভেতরে পপুলেশন প্যারামিটারের মান এস্টিমেট করাকে ইন্টারভ্যাল এস্টিমেশন বলা হয়। ইন্টারভ্যাল এস্টিমেশন একটি কনফিডেন্স লেভেলের সমন্বয়ে গঠিত যেমন ৯০% কনফিডেন্স লেভেল, ৯৫% কনফিডেন্স লেভেল, ৯৯ % কনফিডেন্স লেভেল ইত্যাদি।

ইন্টারভ্যাল এস্টিমেশন প্রধানত দুই ভাবে করা হয়। যখন পপুলেশন স্ট্যান্ডার্ড ডেভিয়শন σ জানা থাকে তখন জেড ডিস্ট্রিবিউশন অনুসরন করা হয় এবং σ অজানা থাকলে টি ডিস্ট্রিবিউশন অনুসরন করা হয় ।

উভয় ক্ষেত্রেই স্যাম্পল সাইজ ৩০ এর কম বা বেশী কিনা সেটি দেখা হয়। স্যাম্পল সাইজ যদি ৩০ এর বেশী হয় তাহলে সেটিকে লার্জ স্যাম্পল ধরা হয় , অপরদিকে স্যাম্পল সাইজ যদি ৩০ এর কম হয় তাহলে সেটিকে স্মল স্যাম্পল ধরা হয় , স্মল স্যাম্পলের ক্ষেত্রে জেড ডিস্ট্রিবিউশন বা টি ডিস্ট্রিবিউশনের শর্ত পূরন করতে হলে স্যাম্পল যে পপুলেশন থেকে নেয়া হয়েছে সেই পপুলেশনকে অবশ্যই নরমাল ডিস্ট্রিবিউশন অনুসরন করতে হবে।

স্যাম্পল যদি ৩০ এর কম হয় এবং স্যাম্পল যে পপুলেশন থেকে নেয়া হয়েছে সেটি নরমাল ডিস্ট্রিবিউশন অনুসরন না করে সেক্ষেত্রে জেড ডিস্ট্রিবিউশন , টি ডিস্ট্রিবিউশন বা অন্যান্য পদ্ধতি অনুসরন করা যাবে না । সেক্ষেত্রে আমাদের নন-প্যারামেট্রিক মেথড অনুসরন করতে হবে।

σ যখন জানা

পপুলেশনের স্ট্যান্ডার্ড ডেভিয়েশন যদি আমাদের জানা থাকে সেক্ষেত্রে আমরা নিম্নোক্ত পদ্ধতিতে ইন্টারভ্যাল এস্টিমেশন করি।

গানিতিক উদাহরন

মনে করুন একজন গবেষক কোন একটি শহরের মিডিয়াম সাইজ এপার্টমেন্টের গড় দামের ইন্তারভ্যাল এস্টিমেট করতে চায়। এজন্য তিনি ১৫০০ টি এপার্টমেন্টেের বিক্রয় মূল্যের স্যাম্পল ডেটা সংগ্রহ করলেন। স্যাম্পল ডেটার এপার্টমেন্টেের গড় বিক্রয়মূল্য ২৯৯৭২০ ডলার । পূর্বের গবেষণা থেকে জানা যায় ঐ শহরের সকল এপার্টমেন্টেে বিক্রয়মূল্যের (পপুলেশন) স্ট্যান্ডার্ড ডেভিয়েশন ৬৮৬৫০ ডলার। তাহলে ৯৫% কনফিডেন্স ইন্টারভ্যালে সমগ্র শহরের ক্ষেত্রে (পপুলেশন) এপার্টমেন্টেের গড় বিক্রয়মূল্যের ইন্টারভ্যাল কত হবে?

σ যখন অজানা

পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন σ অজানা থাকলে আমরা নিচের পদ্ধতিতে ইন্টারভ্যাল এস্টিমেশন করি। নিচের সমীকরনে আমরা দেখতে পাচ্ছি স্যাম্পল মিন থেকে পপুলেশনের জন্য ইন্টারভ্যাল এস্টিমেট করার জন্য স্যাম্পলের স্ট্যান্ডার্ড ডেভিয়েশন ব্যাবহার করি, কারন আমাদের এক্ষেত্রে আমাদের পুপুলেশনের স্ট্যান্ডার্ড ডেভিয়েশন অজানা থাকে। অজানা σ এর জন্য আমরা নির্দিষ্ট কনফিডেন্স লেভেলের জন্য t এর একটি মান গ্রহন করি এবং এক্ষেত্রে ডিগ্রিস অব ফ্রিডম নামের আরেকটি বিষয় গননা করা হয়। সাধারনত স্যাম্পল সাইজ n এর মান থেকে 1 বিয়োগ করে ডিগ্রিস অব ফ্রিডম বের করা হয়।

গানিতিক উদাহরন

একজন চিকিৎসক কোন শহরের সকল প্রাপ্ত বয়স্ক পুরুষদের রক্তের কলেস্টোরেলের গড়ের ইন্টারভ্যাল মান জানতে চান। এজন্য তিনি ২৫ জনের স্যাম্পল নিলেন এবং স্যাম্পল থেকে কোলেস্টেরলের গড় মান পাওয়া গেল ১৮৬ mg/dL এবং স্যাম্পলের স্ট্যান্ডার্ড ডেভিয়েশন পাওয়া যায় 12 mg/dL । ধরে নেয়া হোল ঐ শহরের প্রাপ্ত বয়স্ক পুরুষদের রক্তের কলেস্টোরেল নরমাল ডিস্ট্রিবিউশন অনুসরন করে। ৯৫% কনফিডেন্স ইন্টারভ্যালে ঐ শহরের সমস্ত প্রাপ্ত বয়স্ক পুরুষদের রক্তের কোলেস্টেরলের গড়ের ইন্টারভ্যাল মান কত হবে ?

পপুলেশন প্রপশনের ইন্টারভ্যাল এস্টিমেশন

বাস্তব জীবনে আমরা এমন ধরনের কিছু সমস্যা পাবো যেখানে পপুলেশনের অনুপাত বা প্রপশনের ইন্টারভ্যাল এস্টিমেট করতে হয়। উদাহরণ স্বরূপ বলা যায়, অনেক সময় আমরা দেখে থাকি কোন নির্বাচনের পূর্বে কিছু সার্ভে করা হয় এবং সেই সার্ভের ফলাফলের উপর ভিত্তি করে বলা হয় অমুক দল "এত থেকে এত " শতাংশ ভোট পেতে পারে অথবা "এত থেকে এত " শতাংশ মানুষ এই বিষয়ে একমত পোষণ করতে পারে।

এধরনের ক্ষেত্রে আমরা নিম্নোক্ত পদ্ধতিতে স্যাম্পল প্রপশন থেকে পপুলেশন প্রপশন ইন্টারভ্যাল এস্টিমেট করে থাকি।

গানিতিক উদাহরণ

২০০৯ সালে পিউ রিসার্চ সেন্টার ১৮ থেকে ২৯ বছর বয়সি ১০০০ মানুষকে স্যাম্পল হিসাবে বাছাই করে তাদের ভেতর একটি গবেষণা পরিচালনা করে। সেই গবেষণায় তাদের কাছে জানতে চাওয়া হয়েছিল " তাদের জীবনে ধর্মের কোন গুরুত্ব রয়েছে কিনা ? " । ৪৪% মানুষ জানায় তাদের জীবনে ধর্মের অবস্থান অত্যন্ত গুরুত্বপূর্ণ।

উক্ত তথ্যের ভিত্তিতে ৯৯% কনফিডেন্স ইন্টারভ্যালে পপুলেশনের ক্ষেত্রে এই প্রপশন এস্টিমেট করুন ।

Last updated