ডাটা সাইন্সের হাতেখড়ি
  • ভূমিকা
  • লেখকের পরিচয়
  • বইটি যেভাবে পড়বেন
  • ডেটার সাথে পরিচয়
  • ডেটা সাইন্স কি ?
  • বুদ্ধিমান যন্ত্রের উত্থান পর্ব
  • ডেটা সাইন্স পাইপলাইন এবং ডোমেইন নলেজ
  • ডেটা সাইন্স টুল বক্স
  • পরিসংখ্যানের সাথে পরিচয়
    • পরিসংখ্যান কি ?
    • স্যাম্পলিং
    • কেন্দ্রীয় প্রবনতা
    • ডেটার বিস্তার
    • কোভ্যারিয়্যান্স এবং কোরিলেশন
    • ইম্পিরিক্যাল ল অব ডিস্ট্রিবিউশন
    • পরিসংখ্যান ল্যাব-১ঃ বেসিক পরিসংখ্যান
    • ইনফারেন্স ও এস্টিমেশন
    • হাইপোথিসিস টেস্টিং
  • প্রবাবিলিটি
    • প্রবাবিলিটির পরিচয়
    • বিভিন্ন ধরনের ইভেন্ট
    • প্রবাবিলিটি ট্রি
    • বেইজ থিওরাম
    • প্রবাবিলিটি ল্যাব -১ঃ বেসিক প্রবাবিলিটি
    • প্রবাবিলিটি ডিস্ট্রিবিউশন
    • প্রবাবিলিটি ল্যাব-২ঃ প্রবাবিলিটি ডিস্ট্রিবিউশন
  • লিনিয়ার অ্যালজেব্রা
  • ডেটা ক্লিনিং
  • ডেটা ট্রান্সফরমেশন
  • এক্সপ্লোরেটরি ডেটা এনালাইসিস
  • মেশিন লার্নিং এর সাথে পরিচয়
  • সুপারভাইজড লার্নিং
    • লিনিয়ার রিগ্রেশন
    • পলিনমিয়াল রিগ্রেশন
    • নেইভ বেইজ ক্লাসিফায়ার
    • লজিস্টিক রিগ্রেশনঃ বাইনোমিয়াল
    • লজিস্টিক রিগ্রেশনঃ মাল্টিনোমিয়াল
    • কে-নিয়ারেস্ট নেইবোরস
    • ক্লাসিফিকেশন এন্ড রিগ্রেশন ট্রি
    • র‍্যান্ডম ফরেস্ট
    • অ্যাডাপ্টিভ বুস্টিং
    • গ্রাডিয়েন্ট বুস্টিং
    • এক্সট্রিম গ্রাডিয়েন্ট বুস্টিং
    • সাপোর্ট ভেক্টর মেশিন
    • কে ফোল্ড ক্রস ভ্যালেইডেশন
  • আনসুপারভাইজড লার্নিং
    • কে-মিনস ক্লাস্টারিং
    • হায়ারার্কিক্যাল ক্লাস্টারিং
    • অ্যাসোসিয়েশন রুলসঃ অ্যাপ্রিওরি অ্যালগরিদম
    • প্রিন্সিপাল কম্পোনেন্ট এনালাইসিস এবং ডাইমেনশনালিটি রিডাকশন
  • রিইনফোর্সমেন্ট লার্নিং
  • সংযুক্তি
    • জেড টেবিল
    • টি টেবিল
    • স্টাডি রিসোর্স
    • চিট শিট
Powered by GitBook
On this page

Was this helpful?

  1. পরিসংখ্যানের সাথে পরিচয়

কেন্দ্রীয় প্রবনতা

"If you survived a storm, you won’t be bothered by the rain."-- Ancient Chinese Proverbs

Previousস্যাম্পলিংNextডেটার বিস্তার

Last updated 4 years ago

Was this helpful?

মিন , মোড এবং মিডিয়ানকে কোন ডেটার কেন্দ্রীয় প্রবনতার পরিমাপক। অনেক আমরা কোন ডেটাকে বিন্যস্ত করলে পাহাড়ের চূড়া, বালির ঢিবি বা ঘন্টার আকৃতির মত দেখতে পাই। অধিকাংশ ডেটাই অনেকটা মাঝের দিকে ঘনীভূত বা কেন্দ্রভুত হয়ে থাকে। ডেটার এই মাঝামাঝি থাকার প্রবনতাকে কেন্দ্রীয় প্রবনতা বা সেন্ট্রাল ট্যান্ডেন্সি বলে।

মিন বা গড়- মিন হচ্ছে এভারেজ বা গড়। সহজ কথায় সবগুলো সংখ্যার যোগফলকে মোট যে কয়টি সংখ্যা , সেটি দ্বারা ভাগ করা।মনে করি একটি ক্লাসে ১০ জন শিক্ষার্থীর বয়স যথাক্রমে 14,13,11,14,15,12,16,17,11,14।

অর্থাৎ আমরা বলতে পারি ঐ ক্লাসের শিক্ষার্থীদের গড় বয়স 13.7 বছর।

মোড- মোড হচ্ছে সবথেকে কমন সংখ্যা বা যে সংখ্যাটি সবার থেকে বেশী বার এসেছে।

উপরের ডেটার দিকে লক্ষ্য করলে 14 পাওয়া যায় 3 বার, 11 পাওয়া যায় 2 বার এবং 13,12,15,16,17 পাওয়া যায় 1 বার করে। সুতরাং 14 সবথেকে বেশী 3 বার এসেছে। এই ডেটার জন্য মোড হচ্ছে 14।

ডেটা যদি হয় কন্টিনিউয়াস তবে মোড খুব বেশী স্বচ্ছ ধারনা নাও দিতে পারে।

মিডিয়ান- মিডিয়ানকে বলা হয় মাঝখানের মান। ডেটাকে সর্টিং বা ক্রমানুসারে সাজিয়ে মাঝের যে মান পাওয়া যায় সেটিই মিডিয়ান। ডেটার মোট অবজারভেশন যদি বিজোড় সংখ্যক হয় তবে সহজেই মাঝের মানটি পাওয়া যায়, কিন্তু অবজারভেশন যদি জোড় সংখ্যক হয় সেক্ষেত্রে মাঝের যেকোন দুটি ডেটার গড়কে মিডিয়ান হিসাবে ধরা হয়।

বিজোড় হলে ,

মনে করি ৯ জন শিক্ষার্থীর বয়স 14,13,11,15,12,16,17,11,14 । সর্টিং করার পরে আমরা পাই, 11,11,12,13,14,14,15,16,17 । শর্টেড ডেটার মাঝের ভ্যালু হচ্ছে 14, সুতরাং এটিই হচ্ছে মিডিয়ান।

জোড় হলে,

মনে করি ১০ জন শিক্ষার্থীর বয়স যথাক্রমে 14, 13 , 11 , 14 , 15 , 12 , 16 , 17 , 11 , 14। সর্টিং করার পরে আমরা পাই, 11,11,12,13,14,14,14, 15,16,17 এখন মাঝের দুটি মানের গড় (14+14)/2= 14 হচ্ছে মিডিয়ান।

মিডিয়ান কেন দরকার ?

আপনার মনে প্রশ্ন আসতেই পারে মিন থাকতে মিডিয়ান আবার কেন দরকার ? মিডিয়ান এক্সট্রিম ভ্যালু বা আউটলায়ার দ্বারা প্রভাবিত হয় না।

আউটলায়ার - আউটলায়ার হচ্ছে দলছুট ডেটা, মানে যে অন্যান্যদের মত নয়। যার মান অধিকাংশ মানের চেয়ে অনেক কম অথবা অনেক বেশী। মনে করি কোন ক্লাসের ১১ জন শিক্ষার্থীর ভেতর প্রথম ১০ জনের বয়স যথাক্রমে 14, 13 , 11 , 14 , 15 , 12 , 16 , 17 , 11 , 14 এবং ১১ তম শিক্ষার্থীর বয়স ২৩ বছর । এই ১১ তম জনই হচ্ছে ব্যাতিক্রমি , যার মান এক্সট্রিম , এটিই হচ্ছে আউটলায়ার।

আউটলায়ারের কারনে মিন পরিবর্তিত হয়ে যেতে পারে অর্থাৎ এভারেজ মান কমে বা বেড়ে যেতে পারে কিন্তু আউটলায়ারের কারনে মিডিয়ান ভ্যালু প্রভাবিত হয় না। এজন্যই মিডিয়ানের প্রয়োজন।