হাইপোথিসিস টেস্টিং

“Yesterday I was clever, so I wanted to change the world. Today I am wise, so I am changing myself.”― Mawlana Jalal-al-Din Rumi

পরিসংখ্যান জগতের অত্যন্ত দুর্বোধ্য এবং জটিল একটি অংশ হচ্ছে হাইপোথিসিস । এই অধ্যায়ে আমরা চেষ্টা করবো হাইপোথিসিস সম্পর্কে ফান্ডামেন্টাল ধারণাগুলো সহজ ভাবে আলোচনা করতে।

সহজ কথায় হাইপোথিসিস হচ্ছে পপুলেশন সম্পর্কে অনুমান বা কাল্পনিক কোন দাবী। তবে এই কাল্পনিক দাবীকে হতে হবে অবশ্যই গানিতিক ভাবে যাচাই যোগ্য।

হাইপোথিসিস দুই ধরনের হতে পারে

নাল হাইপোথিসিস- নাল হাইপোথিসিস হচ্ছে পপুলেশন সম্পর্কিত এমন একটি দাবী যা প্রাথমিক ভাবে সত্য হিসেবে ধরে নেয়া হয়, যতক্ষন না পর্যন্ত এটি মিথ্যা প্রমানিত হয়। নাল হাইপোথিসিস কে H0 দ্বারা প্রকাশ করা হয়। নাল হাইপোথিসিস এর এক্সপ্রেশন এ =, <= অথবা >= সাইন থাকতে পারে।
অল্টারনেটিভ হাইপোথিসিস- নাল হাইপোথিসিস যদি মিথ্যা হিসাবে প্রমানিত সেক্ষেত্রে আরেকটি হাইপোথিসিস বিকল্প হিসাবে রাখা হয় যাকে সত্য বলে ধরে নেয়া হয়, এই হাইপোথিসিসকে অল্টারনেটিভ হাইপোথিসিস বলে। অল্টারনেটিভ হাইপোথিসিস কে HA দ্বারা প্রকাশ করা হয়। অল্টারনেটিভ হাইপোথিসিস এ নাল হাইপোথিসিস এর এক্সপ্রেশন সমূহ ( =, <= অথবা >= ) থাকতে পারবে না। সেক্ষেত্রে অল্টারনেটিভ হাইপোথিসিস এর এক্সপ্রেশন হতে পারে ≠, > , < ইত্যাদি।

হাইপোথিসিস টেস্টিং

কোন হাইপোথিসিস ঠিক আছে কিনা সেটা যাচাই করে দেখাকে হাইপোথিসিস টেস্টিং বলে। হাইপোথিসিস টেস্টিং-এ আমরা কোন নাল হাইপোথিসিস কে বাতিক করতে অথবা গ্রহন করতে পারি।

কোন হাইপোথিসিস টেস্ট করতে গিয়ে সঠিক অনুমানকে ভুল হিসাবে গণ্য হতে পারে আবার ভুল অনুমানকে সঠিক হিসাবে গণ্য হতে পারে। এধরনের ভুলকে হাইপোথিসিস টেস্টিং এর এরর বলা হয়। এই এরর দুই ধরনের হতে পারে,

Type I Error - যখন কোন সত্য নাল হাইপোথিসিসকে রিজেক্ট করা হয় তখন তাকে Type I Error বলে।
Type II Error- যখন কোন মিথ্যা নাল হাইপোথিসিসকে রিজেক্ট করা হয় না তখন তাকে Type II Error বলে।

z টেস্ট এবং t টেস্ট - পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন σ' র মান যখন জানা থাকে তখন আমরা z ডিস্ট্রিবিউশন ব্যাবহার করি এবং এধরনের টেস্টকে z টেস্ট বলে। অপরদিকে পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন σ' র মান যখন অজানা থাকে তখন আমরা t ডিস্ট্রিবিউশন ব্যাবহার করি এবং এধরনের টেস্টকে t টেস্ট বলে। z এবং t টেবিল বইয়ের শেষে দেয়া রয়েছে।

p-value- p-valueহচ্ছে একটি প্রবাবিলিটি ভ্যালু । p-value 'র মাধ্যমে হাইপোথিসিস টেস্ট করার সময় 𝛼 (significance level) যদি p-value'র চেয়ে বড় হয় তবে নাল হাইপোথিসিস রিজেক্ট করা হয়, অপরদিকে 𝛼 যদি p-value'র চেয়ে ছোট হয় তবে নাল হাইপোথিসিস রিজেক্ট করা হয় না।

p-value পদ্ধতিতে হাইপোথিসিস টেস্ট করার ধাপ সমূহ,

ধাপ-১ঃ নাল এবং অল্টারনেটিভ হাইপোথিসিস নির্ধারণ করা
ধাপ-২ঃ কোন ডিস্ট্রিবিউশন অনুসরন করা হবে তা নির্ধারণ করা
ধাপ-৩ঃ p-Value'র মান বের করা
ধাপ-৪ঃ সিদ্ধান্ত গ্রহন করা

𝑝 − 𝑣𝑎𝑙𝑢𝑒 পদ্ধতি ছাড়াও Critical value পদ্ধতিতে হাইপোথিসিস টেস্ট করা যায়। উভয় ক্ষেত্রেই একই ফলাফল আসবে। অধিকাংশ সফটওয়্যার এবং প্রোগ্রামিং ল্যাংগুয়েজ এ 𝑝 − 𝑣𝑎𝑙𝑢𝑒 পদ্ধতির মাধ্যমেই হাইপোথিসিস টেস্ট করা হয়। একারনে আমরা কেবল এই পদ্ধতির উদাহরনই দেখিয়েছি।

One Tail এবং Two Tail টেস্ট - হাইপোথিসিস টেস্টিং এর ক্ষেত্রে আমরা দেখে থাকি 𝛼 (significance level) এর মান কি p-value কে অতিক্রম করেছে কিনা ? অর্থাৎ 𝛼 এর মান যদি নন-রিজেকশন এরিয়ার ( সাদা অংশ) ভেতর থাকে তবে আমরা নাল হাইপোথিসিসকে রিজেক্ট করবো না। অপরদিকে 𝛼 এর মান যদি নন-রিজেকশন এরিয়া অতিক্রম করে রিজেকশন এরিয়ায় পৌঁছে যায় ( লাল অংশ) তবে আমরা নাল হাইপোথিসিসকে রিজেক্ট করবো।

হাইপোথিসিস স্টেটমেন্ট এর উপর ভিত্তি করে নির্ধারিত হবে এটি কি One Tail নাকি Two Tail টেস্ট হবে ? One Tail টেস্ট হলে এটি Left Tail অথবা Right Tail হতে পারে , এক্ষেত্রেও আমরা হাইপোথিসিস স্টেটমেন্ট এর উপর ভিত্তি করে সিদ্ধান্ত নেব টেস্টের ধরন কি হবে ?

সনাক্তকারী বৈশিষ্ট্য

টেস্টের ধরন

অল্টারনেটিভ হাইপোথিসিস এ লেস দেন (<) সাইন

Left Tail Test

অল্টারনেটিভ হাইপোথিসিস এ গ্রেটার দেন (>) সাইন

Right Tail Test

অল্টারনেটিভ হাইপোথিসিস এ নট ইকুয়াল (≠) সাইন

Two Tail Test

z টেস্টের গানিতিক উদাহরন

উদাহরন-১ঃ একটি কোম্পানি দাবী করে তাদের কর্মীদের নতুন মেশিনারিজ এর ব্যাবহার শিখতে গড়ে ৯০ মিনিট সময় লাগে। সম্প্রতি ঐ কোম্পানিতে নতুন সংযুক্ত হওয়া একটি মেশিনের ব্যাবহার শিখতে কর্মীদের ৯০ মিনিট চেয়ে কম বা বেশী সময় লাগে কিনা সেটা জানার কোম্পানির সুপারভাইজার ২০ জন কর্মীর স্যাম্পল সংগ্রহ করলো। উক্ত স্যাম্পলে তাদের নতুন সংযুক্ত হওয়া মেশিনের ব্যাবহার শিখতে গড় সময় ছিল ৮৫ মিনিট। পূর্বের তথ্য থেকে জানা যায় কর্মীদের মেশিনের ব্যাবহার শেখার সময়কাল নরমাল ডিস্ট্রিবিউশন অনুসরন করে এবং এক্ষেত্রে স্ট্যান্ডার্ড ডেভিয়েশন ৭ মিনিট। এখন 𝛼 = .০১ ( অর্থাৎ ৯৯% কনফিডেন্স লেভেল) এর ক্ষেত্রে উক্ত দাবীর সত্যতা যাচাই করুন।

উদাহরন ২ঃ একটি শহরের মেয়র অনুমান করলেন তার শহরে যেসকল পরিবার বসবাস করেন তাদের সম্পদের গড় মূল্য নূন্যতম ৩০০,০০০ ডলার । এই দাবীর/অনুমানের সত্যতা যাচাইয়ের জন্য তিনি র‍্যান্ডম স্যাম্পল এর মাধ্যমে ২৫ টি পরিবারের ডেটা সংগ্রহ করলেন। স্যাম্পল থেকে উক্ত পরিবার সমূহের গড় সম্পদের পরিমান পাওয়া গেল ২৮৮,০০০ ডলার। অতীতের গবেষণা থেকে জানা যায় ঐ শহরের মানুষদের সম্পদের ডিস্ট্রিবিউশনে পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন ৮০,০০০ ডলার। এখন ২.৫ % লেভেল অব সিনিফিক্যান্স এ মেয়রের দাবীর সত্যতা যাচাই করুন।

t টেস্টের গানিতিক উদাহরন

একজন বিশেষজ্ঞ দাবী করেন যারা নিয়মিত ব্যায়াম করেন তাদের অক্সিজেন গ্রহনের গড় মান সাধারন প্রাপ্ত বয়স্ক মানুষদের অক্সিজেন গ্রহনের গড় মানের চেয়ে বেশী। পূর্বের গবেষণা থেকে জানা যায় সাধারন প্রাপ্ত বয়স্ক মানুষদের অক্সিজেন গ্রহনের গড় মান ৩৬.৭ ml/kg । আপনি চাইলেন এই দাবীর সত্যতা যাচাই করবেন। এজন্য আপনি ১৫ নিয়মিত ব্যায়াম করেন এমন মানুষদের র‍্যান্ডম স্যাম্পল হিসাবে বাছাই করলেন এবং তাদের থেকে সংগ্রহীত ডেটা থেকে দেখতে পেলেন , তার গড়ে ৪০.৬ ml/kg পরিমান অক্সিজেন গ্রহন করেন। স্যাম্পলের স্ট্যান্ডার্ড ডেভিয়েশন ৬ ml/kg এটা আগে থেকেই জানা যায় প্রাপ্ত বয়স্ক মানুষদের অক্সিজেন গ্রহনের পরিমান নরমাল ডিস্ট্রিবিউশন অনুসরন করে। এখন আপনাকে ৫% লেভেল অব সিগ্নিফিক্যান্সে এই দাবীর সত্যতা যাচাই করতে হবে।

পপুলেশন প্রপশনের হাইপোথিসিস টেস্ট

একজন বিচারক বললেন তার শহরের যত আইনজীবী আছে তাদের ভেতরে ২৫%'র বেশী আইনজীবী বিভিন্ন মাধ্যমে তাদের আইন ব্যাবসার বিজ্ঞাপন দিয়ে থাকেন। বিচারকের এই দাবীর সত্যতা যাচাইয়ের জন্য একজন গবেষক ২০০ আইনজীবীকে স্যাম্পল হিসাবে বাছাই করলেন। স্যাম্পল থেকে প্রাপ্ত ডেটা থেকে পাওয়া গেলে তাদের মধ্যে ৬৩ জন তাদের ব্যাবসা সম্প্রসারনের জন্য বিভিন্ন সময়ে বিজ্ঞাপন দিয়েছিলেন । ৯৫% কনফিডেন্স লেভেলে গবেষককে বিচারকের এই দাবীর সত্যতা যাচাই করতে হবে।

উপরের পদ্ধতি সমূহ ছাড়াও আরও বিভিন্ন ধরনের হাইপোথিসিস টেস্ট রয়েছে। বইয়ের পরিসর সীমিত রাখার জন্য আমরা সেসকল টেস্ট সম্পর্কে আলোচনা করবো না। তবে সকল টেস্টের উদ্দেশ্য একই।

Previousইনফারেন্স ও এস্টিমেশন Nextপ্রবাবিলিটি

Last updated 5 years ago

Was this helpful?