কোভ্যারিয়্যান্স এবং কোরিলেশন
"A journey of a thousand miles begin with a single step"-- Ancient Chinese Proverb
Last updated
"A journey of a thousand miles begin with a single step"-- Ancient Chinese Proverb
Last updated
মনে করুন আপনি জানতে চাচ্ছেন প্রতিদিনের তাপমাত্রার সাথে আইসক্রিম বেচাকেনার কোন সম্পর্ক আছে কিনা ? এজন্য আপনার বাড়ির পাশের কোনো এক দোকানের কয়েদিনের আইসক্রিম বিক্রির ডেটা নিলেন এবং ঐ দিনগুলোর তাপমাত্রার ডেটা নিলেন। আইসক্রিম বিক্রি এবং তাপমাত্রাকে স্ক্যাটার প্লট করলে পরিস্কার ভাবে বোঝা যায়, তাপমাত্রা বৃদ্ধি পেতে থাকলে আইসক্রিম বিক্রিও বেড়ে যায়। আবার তাপমাত্রা কমে যেতে থাকলে আইস ক্রিম বিক্রিও কমতে থাকে।
কোভ্যারিয়্যান্স- দুটি ভ্যারিয়েবলের একসাথে পরিবর্তনের পরিমাপকেই কোভ্যারিয়্যান্স বলে। কোভ্যারিয়্যান্স এর মাধ্যমে বোঝা যায় দুটি ভ্যারিয়েবল এক সাথে কতটুক পরিবর্তিত হয়, এর মাধ্যমে বোঝা যায় একটি ভ্যারিয়েবলের সাথে আরেকটি ভ্যারিয়েবলের কতখানি সম্পর্ক বিদ্যমান।
পপুলেশন কোভ্যারিয়্যান্স নির্ণয়ের জন্য দুটি ভ্যারিয়েবলকে তাদের গড় মানের বিয়োগফলের গুনফলকে মোট অবজারভেশনের সংখ্যা n দ্বারা ভাগ করতে হয়। অপরদিকে স্যাম্পল কোভ্যারিয়্যান্স নির্ণয়ের ক্ষেত্রে একই পদ্ধতিতে n-1 দ্বারা ভাগ করতে হয়।
আমাদের আইসক্রিম বিক্রির স্যাম্পল ডেটায় তাপমাত্রা এবং আইসক্রিম বিক্রির পরিমানের কোভ্যারিয়্যান্স নির্ণয়ের জন্য আমরা স্যাম্পল কোভ্যারিয়্যান্স এর সূত্র প্রয়োগ করবো।
উপরের ছোট্ট অংকটুক করার মাধ্যমে আমরা জেনে গিয়েছি আইসক্রিম বিক্রির পরিমান এবং তাপমাতার কোভ্যারিয়্যান্স হচ্ছে ৪৮৪.০৯।
কোভ্যারিয়্যান্স মানের কোন স্কেল নেই, ভ্যারিয়েবলের মানের সাথে সাথে কোভ্যারিয়্যান্স এর মানেরও পরিবর্তন হয়। তাই অনেক সময় কোভ্যারিয়্যান্স থেকে সিদ্ধান্তে আসা কষ্টকর হয়ে যায়। একারনে আমারা আরেকটি মেজারমেন্টের সাথে পরিচিত হব, সেটা হচ্ছে কোরিলেশন।
কোরিলেশন- কোরিলেশন হচ্ছে দুটি ভ্যারিয়েবলের মধ্যে সম্পর্কের পরিমাপ। অর্থাৎ একটি ভ্যারিয়েবলের মান বাড়লে বা কমলে অপর ভ্যারিয়েবলের মান কতখানি বাড়বে বা কমবে সেটার পরিমাপই কোরিলেশন এর মাধ্যমে প্রকাশ করা হয়। কোরিলেশন এর মান স্কেলাইজড, -1 থেকে 1 এর ভেতরে থাকে। 1 এর যত কাছাকাছি হবে ভ্যারিয়েবল দুটির মধ্যে সম্পর্ক তত শক্তিশালী , অপরদিকে ০ এর যত কাছাকাছি সম্পর্ক তত দুর্বল।
উপরের সমীকরণটি পিয়ারসন কোরিলেশন সমীকরণ , একে r দ্বারা প্রকাশ করা হয়।
পিয়ারসনের পদ্ধতি অনুযায়ী আমারা দেখতে পাচ্ছি আইসক্রিম বিক্রি এবং তাপমাত্রার সম্পর্ক হচ্ছে ০.৯৫ , এটি অত্যন্ত শক্তিশালী কোরিলেশন।
কোরিলেশন নির্ণয়ের আরেকটি পদ্ধতি রয়েছে যেটা Ordinal ডেটার ক্ষেত্রে ব্যাবহার করা হয় যাকে Ranked Order Correlation বলে। প্রয়োগ সীমিত বিধায় এই বইয়ে সেটি আলোচনা করা হবে না।
R এর মান
কোরিলেশন
-১
পারফেক্ট নেগেটিভ কোরিলেশন
-০.৭৫ বা এর থেকে ছোট কিন্তু -১ এর চেয়ে বড়
শক্তিশালী নেগেটিভ কোরিলেশন
-০.২৫ বা এর থেকে ছোট কিন্তু -০.৭৫ থেকে বড়
মোটামুটি নেগেটিভ কোরিলেশন
শূন্য থেকে ছোট কিন্তু -০.২৫ এর থেকে বড়
দুর্বল নেগেটিভ কোরিলেশন
০ বা শূন্য
কোরিলেশন নেই
শূন্য থেকে বড় কিন্তু ০.২৫ এর থেকে ছোট
দুর্বল পজিটিভ কোরিলেশন
০.২৫ বা এর থেকে বড় কিন্তু ০.৭৫ থেকে ছোট
মোটামুটি পজিটিভ কোরিলেশন
০.৭৫ বা এর থেকে বড় কিন্তু ১ এর চেয়ে ছোট
শক্তিশালী পজিটিভ কোরিলেশন
১
পারফেক্ট পজিটিভ কোরিলেশন