পলিনমিয়াল রিগ্রেশন
Last updated
Was this helpful?
Last updated
Was this helpful?
লিনিয়ার রিগ্রেশনে আমরা দেখেছি ডিপেন্ডেন্ট এবং ইন্ডিপেন্ডেন্ট ভ্যারিয়েবলের সম্পর্ক হয় সরল রৈখিক বা লিনিয়ার, কিন্তু বাস্তব জীবনে আমরা অনেক ডেটাসেট পেয়ে থাকবো যার ডিপেন্ডেন্ট এবং ইন্ডিপেন্ডেন্ট ভ্যারিয়েবলের সম্পর্ক হয় সরল রৈখিক হবে না। এধরনের অ-সরল রৈখিক সম্পর্ককে আমরা নন-লিনিয়ার বা পলিনমিয়াল ইকুয়েশনের মাধ্যমে সমাধান করে থাকি।
উপরের ছবিতে আমরা বিভিন্ন ধরনের নন-লিনিয়ার ফাংশনের চেহারা দেখতে পাই, এখান থেকে খুব সহজেই বোঝা যায় এধরনের নন-লিনিয়ার রিলেশনশিপকে কখনোই লিনিয়ার ফাংশনের মাধ্যমে সঠিক ভাবে ব্যখ্যা করা সম্ভব নয়।
পলিনমিয়াল রিগ্রেশনের কিছু বৈশিষ্ট্য
যেসকল ডেটাসেট লিনিয়ার মডেলে ভালোভাবে ফিট হয় না, পলিনমিয়াল মডেলের মাধ্যমে তাদেরকে বেশ ভালো করেই ফিট করা যায়।
খুব সহজেই হাই অর্ডারের ফাংশনের মাধ্যমে মডেল তৈরি করা যায়
ডেটায় আউটলেয়ার থাকলে মডেল প্রভাবিত হয়।
পলিনমিয়াল অর্ডার খুব বেশী হলে মডেল ওভারফিট করতে পারে।
বাংলাদেশের জিএনপি'র পলিনমিয়াল রিগ্রেশন
পলিনমিয়াল রিগ্রেশন বোঝার জন্য আমরা বাংলাদেশের জিএনপি'র ডেটাসেট ব্যবহার করবো। এই ডেটাসেটে ১৯৮০ থেকে ২০১৯ সাল পর্যন্ত বাংলাদেশের জনসংখ্যা ও জিএনপি'র আকার বিলিয়ন টাকায় দেয়া আছে।
আমাদের ডেটাসেটটি দেখতে অনেকটা এরকম,
বাংলাদেশের জনসংখ্যা এবং জিএনপি'র আকারের সাথে আমরা যদি রিগ্রেশন প্লট আঁকি তাহলে আমরা দেখতে পাই জনসংখ্যা বৃদ্ধি এবং জিএনপি বৃদ্ধির হার অনেকটা এক্সপোনেনশিয়াল ফাংশনের মত। অপরদিকে লিনিয়ার রিগ্রেশন লাইন কোন ভাবেই এই রিলেশনশিপকে ফিট করতে পারে না। একারনেই আমাদের অবশ্যই কোন নন-লিনিয়ার ফাংশনের মাধ্যমে এই রিলেশনশিপেকে ফিট করবো।
আমরা ২ ডিগ্রী অর্ডারে পলিনমিয়াল ফাংশনের মাধ্যমে রিগ্রেশন লাইনকে আমাদের ডেটাসেটে ফিট করলে আমরা দেখতে পাই রিগ্রেশন লাইন আগের তুলনায় বক্র রৈখিক হয়েছে এবং ডেটা পয়েন্ট গুলোর সাথে আগের চেয়ে বেশী ফিট হয়েছে।
এবার ৩ ডিগ্রি ডিগ্রী অর্ডার পলিনমিয়াল ফাংশন ব্যবহার করলে আমরা দেখতে পাই রিগ্রেশন লাইন ডেটা পয়েন্ট গুলোর সাথে প্রায় পুরোপুরি ফিট হয়েছে।
সুতরাং আমরা বুঝতে পারলাম পলিনমিয়াল অর্ডার ৩ ব্যবহার করলে সেটা আমাদের ডেটার সাথে সবথেকে ভালোভাবে ফিট হবে। এবার ৩ ডিগ্রী অর্ডারে পলিনমিয়াল রিগ্রেশনের জন্য আমরা আমাদের ডেটাসেটকে ট্রান্সফরমেশন করে নেব,
পলিনমিয়াল রিগ্রেশনের জন্য আলাদা কোন ফাংশন নেই। ডেটাকে ট্রান্সফরমেশনের মাধ্যমে পলিনমিয়াল ফিচার সেট করে , লিনিয়ার ফাংশনের মাধ্যমেই পাইথনে পলিনমিয়াল রিগ্রেশন করা হয়।
আমাদের মডেল এখন তৈরি। এবার অ্যাকুরেসি চেক করার পালা।
আমরা দেখতে পাচ্ছি আমাদের পলিনমিয়াল মডেল প্রায় ৯৯% নির্ভুল ভাবে প্রেডিকশন করতে পেরেছে।
এবার এই মডেল দিয়ে প্রিডিকশনের পালা, মনে করুন আমাদের জনসংখ্যা ২০০ মিলিয়ন (২০ কোটি) হলে আমাদের জিএনপি'র আকার কত হবে ?
array([[32780.39276548]])
অর্থাৎ বাংলাদেশের জনসংখ্যা ২০০ মিলিয়ন হলে তখন আমাদের জিএনপি'র আকার হবে ৩২৭২৮০.৩৯ বিলিয়ন টাকা ।
লিনিয়ার রিগ্রেশনের সাথে পারফরম্যান্স তুলনা
আমরা যদি একই ডেটাসেট ব্যবহার করি লিনিয়ার রিগ্রেশন মডেল তৈরি করে তাহলে দেখতে পাবো লিনিয়ার মডেলের অ্যাকুরেসি মাত্র ৬৭% , সুতরাং এটা খুব সহজেই বোঝা যাচ্ছে নন-লিনিয়ার ডেটার ক্ষেত্রে পলিনমিয়াল মডেল কতখানি কার্যকর ।