কোভ্যারিয়্যান্স এবং কোরিলেশন

"A journey of a thousand miles begin with a single step"-- Ancient Chinese Proverb
মনে করুন আপনি জানতে চাচ্ছেন প্রতিদিনের তাপমাত্রার সাথে আইসক্রিম বেচাকেনার কোন সম্পর্ক আছে কিনা ? এজন্য আপনার বাড়ির পাশের কোনো এক দোকানের কয়েদিনের আইসক্রিম বিক্রির ডেটা নিলেন এবং ঐ দিনগুলোর তাপমাত্রার ডেটা নিলেন। আইসক্রিম বিক্রি এবং তাপমাত্রাকে স্ক্যাটার প্লট করলে পরিস্কার ভাবে বোঝা যায়, তাপমাত্রা বৃদ্ধি পেতে থাকলে আইসক্রিম বিক্রিও বেড়ে যায়। আবার তাপমাত্রা কমে যেতে থাকলে আইস ক্রিম বিক্রিও কমতে থাকে।
ছবি - তাপমাত্রা এবং আইসক্রিম বিক্রির ডেটাসেট এবং স্কাটার প্লট ( সূত্র- ইন্টারনেট )
কোভ্যারিয়্যান্স- দুটি ভ্যারিয়েবলের একসাথে পরিবর্তনের পরিমাপকেই কোভ্যারিয়্যান্স বলে। কোভ্যারিয়্যান্স এর মাধ্যমে বোঝা যায় দুটি ভ্যারিয়েবল এক সাথে কতটুক পরিবর্তিত হয়, এর মাধ্যমে বোঝা যায় একটি ভ্যারিয়েবলের সাথে আরেকটি ভ্যারিয়েবলের কতখানি সম্পর্ক বিদ্যমান।
পপুলেশন কোভ্যারিয়্যান্স নির্ণয়ের জন্য দুটি ভ্যারিয়েবলকে তাদের গড় মানের বিয়োগফলের গুনফলকে মোট অবজারভেশনের সংখ্যা n দ্বারা ভাগ করতে হয়। অপরদিকে স্যাম্পল কোভ্যারিয়্যান্স নির্ণয়ের ক্ষেত্রে একই পদ্ধতিতে n-1 দ্বারা ভাগ করতে হয়।
ছবি- কোভ্যারিয়্যান্স নির্ণয়ের সমীকরন
আমাদের আইসক্রিম বিক্রির স্যাম্পল ডেটায় তাপমাত্রা এবং আইসক্রিম বিক্রির পরিমানের কোভ্যারিয়্যান্স নির্ণয়ের জন্য আমরা স্যাম্পল কোভ্যারিয়্যান্স এর সূত্র প্রয়োগ করবো।
উপরের ছোট্ট অংকটুক করার মাধ্যমে আমরা জেনে গিয়েছি আইসক্রিম বিক্রির পরিমান এবং তাপমাতার কোভ্যারিয়্যান্স হচ্ছে ৪৮৪.০৯।
কোভ্যারিয়্যান্স মানের কোন স্কেল নেই, ভ্যারিয়েবলের মানের সাথে সাথে কোভ্যারিয়্যান্স এর মানেরও পরিবর্তন হয়। তাই অনেক সময় কোভ্যারিয়্যান্স থেকে সিদ্ধান্তে আসা কষ্টকর হয়ে যায়। একারনে আমারা আরেকটি মেজারমেন্টের সাথে পরিচিত হব, সেটা হচ্ছে কোরিলেশন।
কোরিলেশন- কোরিলেশন হচ্ছে দুটি ভ্যারিয়েবলের মধ্যে সম্পর্কের পরিমাপ। অর্থাৎ একটি ভ্যারিয়েবলের মান বাড়লে বা কমলে অপর ভ্যারিয়েবলের মান কতখানি বাড়বে বা কমবে সেটার পরিমাপই কোরিলেশন এর মাধ্যমে প্রকাশ করা হয়। কোরিলেশন এর মান স্কেলাইজড, -1 থেকে 1 এর ভেতরে থাকে। 1 এর যত কাছাকাছি হবে ভ্যারিয়েবল দুটির মধ্যে সম্পর্ক তত শক্তিশালী , অপরদিকে ০ এর যত কাছাকাছি সম্পর্ক তত দুর্বল।
উপরের সমীকরণটি পিয়ারসন কোরিলেশন সমীকরণ , একে r দ্বারা প্রকাশ করা হয়।
পিয়ারসনের পদ্ধতি অনুযায়ী আমারা দেখতে পাচ্ছি আইসক্রিম বিক্রি এবং তাপমাত্রার সম্পর্ক হচ্ছে ০.৯৫ , এটি অত্যন্ত শক্তিশালী কোরিলেশন।
ছবি - বিভিন্ন ধরনের কোরিলেশন (সূত্র- ইন্টারনেট)
R এর মান
কোরিলেশন
-১
পারফেক্ট নেগেটিভ কোরিলেশন
-০.৭৫ বা এর থেকে ছোট কিন্তু -১ এর চেয়ে বড়
শক্তিশালী নেগেটিভ কোরিলেশন
-০.২৫ বা এর থেকে ছোট কিন্তু -০.৭৫ থেকে বড়
মোটামুটি নেগেটিভ কোরিলেশন
শূন্য থেকে ছোট কিন্তু -০.২৫ এর থেকে বড়
দুর্বল নেগেটিভ কোরিলেশন
০ বা শূন্য
কোরিলেশন নেই
শূন্য থেকে বড় কিন্তু ০.২৫ এর থেকে ছোট
দুর্বল পজিটিভ কোরিলেশন
০.২৫ বা এর থেকে বড় কিন্তু ০.৭৫ থেকে ছোট
মোটামুটি পজিটিভ কোরিলেশন
০.৭৫ বা এর থেকে বড় কিন্তু ১ এর চেয়ে ছোট
শক্তিশালী পজিটিভ কোরিলেশন
পারফেক্ট পজিটিভ কোরিলেশন
কোরিলেশন নির্ণয়ের আরেকটি পদ্ধতি রয়েছে যেটা Ordinal ডেটার ক্ষেত্রে ব্যাবহার করা হয় যাকে Ranked Order Correlation বলে। প্রয়োগ সীমিত বিধায় এই বইয়ে সেটি আলোচনা করা হবে না।