লজিস্টিক রিগ্রেশনঃ মাল্টিনোমিয়াল
Last updated
Last updated
গত অধ্যায়েই আমরা জেনেছি মাল্টিনোমিয়াল লজিস্টিক রিগ্রেশন কি ?প্রেডিকশন ক্লাস যখন দুইয়ের বেশী হয় তখন তাকে মাল্টিনোমিয়াল ক্লাস বলে। এধরনের ডেটায় তিনটি ,চারটি বা এর বেশী যেকোনো সংখ্যক ক্লাস থাকতে পারে। উদাহরন হিসাবে বলা যায় আইরিস ফ্লাওয়ার ডেটাসেটে তিন ধরনের আইরিস ফ্লাওয়ারের ডেটা রয়েছে, অর্থাৎ এর ক্লাস তিন টি। সেক্ষেত্রে এটি একটি মাল্টিনোমিয়াল ক্লাস।
আইরিস হচ্ছে একটি ফুলের নাম। আইরিস ডেটা সেটেকে একারনে আইরিস ফ্লাওয়ার ডেটা সেটও বলা হয়। বিজ্ঞানী R.A. Fisher, ১৯৩৬ সালে এই ডেটা সেটটি প্রকাশ করেন।
আইরিস ডেটা সেটে এই ৩ প্রজাতির আইরিস ফুলের তথ্য সংগ্রহ করা হয়েছে মূলত বৃত্যংশের দৈর্ঘ্য (sepal length) , বৃত্যংশের প্রস্থ (sepal width) , পাপড়ির দৈর্ঘ্য (petal length) এবং পাপড়ির প্রস্থের (petal width) উপর ভিত্তি করে। ফুলটি কোন প্রজাতির সেটা লেবেল হিসাবে রাখা হয়েছে Class Lebel এ। এভাবে ১৫০ টি অবজারভেশন বা রেকর্ড রয়েছে এই ডেটা সেটে।
বাইনোমিয়াল লজিস্টিক রিগ্রেশনের জন্য যে লাইব্রেরী ইমপোর্ট করেছিলাম সেই লাইব্রেরীগুলো দিয়েই মাল্টিনোমিয়াল লজিস্টিক রিগ্রেশন করা যায়। তাই এক্ষেত্রে আমরা শুধুমাত্র ডেটাসেট লোড করে নিচ্ছি,
আমাদের ডেটাসেটটি দেখতে অনেকটা এরকম
এবার ফিচার এবং টার্গেট ভ্যারিয়েবল সেট করে নেব,
এখন টেস্ট এর জন্য ২৫% ডেটা রেখে বাকি ডেটা দিয়ে মডেল ট্রেইন করবো,
আমাদের মডেল এখন তৈরি। এবার অ্যাকুরেসি চেক করার পালা।
আমারা দেখতে পাচ্ছি আমাদের মডেল ৯৭.৩৬% নির্ভুল ভাবে প্রিডিকশন করতে পারছে।
চলুন নতুন একটি ডেটা দিয়ে প্রিডিকশন করি। মনে করুন আপনার কাছে একটি আইরিস ফুল রয়েছে কিন্তু আপনি জানেন না এটি কোন প্রজাতির। আপনার কাজ হবে আমাদের এই মডেলে ঐ ফুলের sepal_length, petal_length, petal_length, petal_width এর মাপ মডেলে ইনপুট দেয়া, আর মডেলের কাজ হবে অনুমান করে বলে দেয়া ফুলটি কোন প্রজাতির।
array(['setosa'], dtype=object)
মডেল বলছে ফুলটি setosa প্রজাতির।