হাইপোথিসিস টেস্টিং

“Yesterday I was clever, so I wanted to change the world. Today I am wise, so I am changing myself.”― Mawlana Jalal-al-Din Rumi
পরিসংখ্যান জগতের অত্যন্ত দুর্বোধ্য এবং জটিল একটি অংশ হচ্ছে হাইপোথিসিস । এই অধ্যায়ে আমরা চেষ্টা করবো হাইপোথিসিস সম্পর্কে ফান্ডামেন্টাল ধারণাগুলো সহজ ভাবে আলোচনা করতে।
সহজ কথায় হাইপোথিসিস হচ্ছে পপুলেশন সম্পর্কে অনুমান বা কাল্পনিক কোন দাবী। তবে এই কাল্পনিক দাবীকে হতে হবে অবশ্যই গানিতিক ভাবে যাচাই যোগ্য।
হাইপোথিসিস দুই ধরনের হতে পারে
  • নাল হাইপোথিসিস- নাল হাইপোথিসিস হচ্ছে পপুলেশন সম্পর্কিত এমন একটি দাবী যা প্রাথমিক ভাবে সত্য হিসেবে ধরে নেয়া হয়, যতক্ষন না পর্যন্ত এটি মিথ্যা প্রমানিত হয়। নাল হাইপোথিসিস কে H0 দ্বারা প্রকাশ করা হয়। নাল হাইপোথিসিস এর এক্সপ্রেশন এ =, <= অথবা >= সাইন থাকতে পারে।
  • অল্টারনেটিভ হাইপোথিসিস- নাল হাইপোথিসিস যদি মিথ্যা হিসাবে প্রমানিত সেক্ষেত্রে আরেকটি হাইপোথিসিস বিকল্প হিসাবে রাখা হয় যাকে সত্য বলে ধরে নেয়া হয়, এই হাইপোথিসিসকে অল্টারনেটিভ হাইপোথিসিস বলে। অল্টারনেটিভ হাইপোথিসিস কে HA দ্বারা প্রকাশ করা হয়। অল্টারনেটিভ হাইপোথিসিস এ নাল হাইপোথিসিস এর এক্সপ্রেশন সমূহ ( =, <= অথবা >= ) থাকতে পারবে না। সেক্ষেত্রে অল্টারনেটিভ হাইপোথিসিস এর এক্সপ্রেশন হতে পারে ≠, > , < ইত্যাদি।
হাইপোথিসিস টেস্টিং
কোন হাইপোথিসিস ঠিক আছে কিনা সেটা যাচাই করে দেখাকে হাইপোথিসিস টেস্টিং বলে। হাইপোথিসিস টেস্টিং-এ আমরা কোন নাল হাইপোথিসিস কে বাতিক করতে অথবা গ্রহন করতে পারি।
কোন হাইপোথিসিস টেস্ট করতে গিয়ে সঠিক অনুমানকে ভুল হিসাবে গণ্য হতে পারে আবার ভুল অনুমানকে সঠিক হিসাবে গণ্য হতে পারে। এধরনের ভুলকে হাইপোথিসিস টেস্টিং এর এরর বলা হয়। এই এরর দুই ধরনের হতে পারে,
  • Type I Error - যখন কোন সত্য নাল হাইপোথিসিসকে রিজেক্ট করা হয় তখন তাকে Type I Error বলে।
  • Type II Error- যখন কোন মিথ্যা নাল হাইপোথিসিসকে রিজেক্ট করা হয় না তখন তাকে Type II Error বলে।
z টেস্ট এবং t টেস্ট - পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন σ' র মান যখন জানা থাকে তখন আমরা z ডিস্ট্রিবিউশন ব্যাবহার করি এবং এধরনের টেস্টকে z টেস্ট বলে। অপরদিকে পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন σ' র মান যখন অজানা থাকে তখন আমরা t ডিস্ট্রিবিউশন ব্যাবহার করি এবং এধরনের টেস্টকে t টেস্ট বলে। z এবং t টেবিল বইয়ের শেষে দেয়া রয়েছে।
p-value- p-valueহচ্ছে একটি প্রবাবিলিটি ভ্যালু । p-value 'র মাধ্যমে হাইপোথিসিস টেস্ট করার সময় 𝛼 (significance level) যদি p-value'র চেয়ে বড় হয় তবে নাল হাইপোথিসিস রিজেক্ট করা হয়, অপরদিকে 𝛼 যদি p-value'র চেয়ে ছোট হয় তবে নাল হাইপোথিসিস রিজেক্ট করা হয় না।
p-value পদ্ধতিতে হাইপোথিসিস টেস্ট করার ধাপ সমূহ,
  • ধাপ-১ঃ নাল এবং অল্টারনেটিভ হাইপোথিসিস নির্ধারণ করা
  • ধাপ-২ঃ কোন ডিস্ট্রিবিউশন অনুসরন করা হবে তা নির্ধারণ করা
  • ধাপ-৩ঃ p-Value'র মান বের করা
  • ধাপ-৪ঃ সিদ্ধান্ত গ্রহন করা
𝑝 − 𝑣𝑎𝑙𝑢𝑒 পদ্ধতি ছাড়াও Critical value পদ্ধতিতে হাইপোথিসিস টেস্ট করা যায়। উভয় ক্ষেত্রেই একই ফলাফল আসবে। অধিকাংশ সফটওয়্যার এবং প্রোগ্রামিং ল্যাংগুয়েজ এ 𝑝 − 𝑣𝑎𝑙𝑢𝑒 পদ্ধতির মাধ্যমেই হাইপোথিসিস টেস্ট করা হয়। একারনে আমরা কেবল এই পদ্ধতির উদাহরনই দেখিয়েছি।
One Tail এবং Two Tail টেস্ট - হাইপোথিসিস টেস্টিং এর ক্ষেত্রে আমরা দেখে থাকি 𝛼 (significance level) এর মান কি p-value কে অতিক্রম করেছে কিনা ? অর্থাৎ 𝛼 এর মান যদি নন-রিজেকশন এরিয়ার ( সাদা অংশ) ভেতর থাকে তবে আমরা নাল হাইপোথিসিসকে রিজেক্ট করবো না। অপরদিকে 𝛼 এর মান যদি নন-রিজেকশন এরিয়া অতিক্রম করে রিজেকশন এরিয়ায় পৌঁছে যায় ( লাল অংশ) তবে আমরা নাল হাইপোথিসিসকে রিজেক্ট করবো।
ছবি - হাইপোথিসিস টেস্টিং (সূত্র- ইন্টারনেট)
হাইপোথিসিস স্টেটমেন্ট এর উপর ভিত্তি করে নির্ধারিত হবে এটি কি One Tail নাকি Two Tail টেস্ট হবে ? One Tail টেস্ট হলে এটি Left Tail অথবা Right Tail হতে পারে , এক্ষেত্রেও আমরা হাইপোথিসিস স্টেটমেন্ট এর উপর ভিত্তি করে সিদ্ধান্ত নেব টেস্টের ধরন কি হবে ?
সনাক্তকারী বৈশিষ্ট্য
টেস্টের ধরন
অল্টারনেটিভ হাইপোথিসিস এ লেস দেন (<) সাইন
Left Tail Test
অল্টারনেটিভ হাইপোথিসিস এ গ্রেটার দেন (>) সাইন
Right Tail Test
অল্টারনেটিভ হাইপোথিসিস এ নট ইকুয়াল (≠) সাইন
Two Tail Test
z টেস্টের গানিতিক উদাহরন
উদাহরন-১ঃ একটি কোম্পানি দাবী করে তাদের কর্মীদের নতুন মেশিনারিজ এর ব্যাবহার শিখতে গড়ে ৯০ মিনিট সময় লাগে। সম্প্রতি ঐ কোম্পানিতে নতুন সংযুক্ত হওয়া একটি মেশিনের ব্যাবহার শিখতে কর্মীদের ৯০ মিনিট চেয়ে কম বা বেশী সময় লাগে কিনা সেটা জানার কোম্পানির সুপারভাইজার ২০ জন কর্মীর স্যাম্পল সংগ্রহ করলো। উক্ত স্যাম্পলে তাদের নতুন সংযুক্ত হওয়া মেশিনের ব্যাবহার শিখতে গড় সময় ছিল ৮৫ মিনিট। পূর্বের তথ্য থেকে জানা যায় কর্মীদের মেশিনের ব্যাবহার শেখার সময়কাল নরমাল ডিস্ট্রিবিউশন অনুসরন করে এবং এক্ষেত্রে স্ট্যান্ডার্ড ডেভিয়েশন ৭ মিনিট। এখন 𝛼 = .০১ ( অর্থাৎ ৯৯% কনফিডেন্স লেভেল) এর ক্ষেত্রে উক্ত দাবীর সত্যতা যাচাই করুন।
উদাহরন ২ঃ একটি শহরের মেয়র অনুমান করলেন তার শহরে যেসকল পরিবার বসবাস করেন তাদের সম্পদের গড় মূল্য নূন্যতম ৩০০,০০০ ডলার । এই দাবীর/অনুমানের সত্যতা যাচাইয়ের জন্য তিনি র‍্যান্ডম স্যাম্পল এর মাধ্যমে ২৫ টি পরিবারের ডেটা সংগ্রহ করলেন। স্যাম্পল থেকে উক্ত পরিবার সমূহের গড় সম্পদের পরিমান পাওয়া গেল ২৮৮,০০০ ডলার। অতীতের গবেষণা থেকে জানা যায় ঐ শহরের মানুষদের সম্পদের ডিস্ট্রিবিউশনে পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন ৮০,০০০ ডলার। এখন ২.৫ % লেভেল অব সিনিফিক্যান্স এ মেয়রের দাবীর সত্যতা যাচাই করুন।
t টেস্টের গানিতিক উদাহরন
একজন বিশেষজ্ঞ দাবী করেন যারা নিয়মিত ব্যায়াম করেন তাদের অক্সিজেন গ্রহনের গড় মান সাধারন প্রাপ্ত বয়স্ক মানুষদের অক্সিজেন গ্রহনের গড় মানের চেয়ে বেশী। পূর্বের গবেষণা থেকে জানা যায় সাধারন প্রাপ্ত বয়স্ক মানুষদের অক্সিজেন গ্রহনের গড় মান ৩৬.৭ ml/kg । আপনি চাইলেন এই দাবীর সত্যতা যাচাই করবেন। এজন্য আপনি ১৫ নিয়মিত ব্যায়াম করেন এমন মানুষদের র‍্যান্ডম স্যাম্পল হিসাবে বাছাই করলেন এবং তাদের থেকে সংগ্রহীত ডেটা থেকে দেখতে পেলেন , তার গড়ে ৪০.৬ ml/kg পরিমান অক্সিজেন গ্রহন করেন। স্যাম্পলের স্ট্যান্ডার্ড ডেভিয়েশন ৬ ml/kg এটা আগে থেকেই জানা যায় প্রাপ্ত বয়স্ক মানুষদের অক্সিজেন গ্রহনের পরিমান নরমাল ডিস্ট্রিবিউশন অনুসরন করে। এখন আপনাকে ৫% লেভেল অব সিগ্নিফিক্যান্সে এই দাবীর সত্যতা যাচাই করতে হবে।
পপুলেশন প্রপশনের হাইপোথিসিস টেস্ট
একজন বিচারক বললেন তার শহরের যত আইনজীবী আছে তাদের ভেতরে ২৫%'র বেশী আইনজীবী বিভিন্ন মাধ্যমে তাদের আইন ব্যাবসার বিজ্ঞাপন দিয়ে থাকেন। বিচারকের এই দাবীর সত্যতা যাচাইয়ের জন্য একজন গবেষক ২০০ আইনজীবীকে স্যাম্পল হিসাবে বাছাই করলেন। স্যাম্পল থেকে প্রাপ্ত ডেটা থেকে পাওয়া গেলে তাদের মধ্যে ৬৩ জন তাদের ব্যাবসা সম্প্রসারনের জন্য বিভিন্ন সময়ে বিজ্ঞাপন দিয়েছিলেন । ৯৫% কনফিডেন্স লেভেলে গবেষককে বিচারকের এই দাবীর সত্যতা যাচাই করতে হবে।
উপরের পদ্ধতি সমূহ ছাড়াও আরও বিভিন্ন ধরনের হাইপোথিসিস টেস্ট রয়েছে। বইয়ের পরিসর সীমিত রাখার জন্য আমরা সেসকল টেস্ট সম্পর্কে আলোচনা করবো না। তবে সকল টেস্টের উদ্দেশ্য একই।