ডাটা সাইন্সের হাতেখড়ি
  • ভূমিকা
  • লেখকের পরিচয়
  • বইটি যেভাবে পড়বেন
  • ডেটার সাথে পরিচয়
  • ডেটা সাইন্স কি ?
  • বুদ্ধিমান যন্ত্রের উত্থান পর্ব
  • ডেটা সাইন্স পাইপলাইন এবং ডোমেইন নলেজ
  • ডেটা সাইন্স টুল বক্স
  • পরিসংখ্যানের সাথে পরিচয়
    • পরিসংখ্যান কি ?
    • স্যাম্পলিং
    • কেন্দ্রীয় প্রবনতা
    • ডেটার বিস্তার
    • কোভ্যারিয়্যান্স এবং কোরিলেশন
    • ইম্পিরিক্যাল ল অব ডিস্ট্রিবিউশন
    • পরিসংখ্যান ল্যাব-১ঃ বেসিক পরিসংখ্যান
    • ইনফারেন্স ও এস্টিমেশন
    • হাইপোথিসিস টেস্টিং
  • প্রবাবিলিটি
    • প্রবাবিলিটির পরিচয়
    • বিভিন্ন ধরনের ইভেন্ট
    • প্রবাবিলিটি ট্রি
    • বেইজ থিওরাম
    • প্রবাবিলিটি ল্যাব -১ঃ বেসিক প্রবাবিলিটি
    • প্রবাবিলিটি ডিস্ট্রিবিউশন
    • প্রবাবিলিটি ল্যাব-২ঃ প্রবাবিলিটি ডিস্ট্রিবিউশন
  • লিনিয়ার অ্যালজেব্রা
  • ডেটা ক্লিনিং
  • ডেটা ট্রান্সফরমেশন
  • এক্সপ্লোরেটরি ডেটা এনালাইসিস
  • মেশিন লার্নিং এর সাথে পরিচয়
  • সুপারভাইজড লার্নিং
    • লিনিয়ার রিগ্রেশন
    • পলিনমিয়াল রিগ্রেশন
    • নেইভ বেইজ ক্লাসিফায়ার
    • লজিস্টিক রিগ্রেশনঃ বাইনোমিয়াল
    • লজিস্টিক রিগ্রেশনঃ মাল্টিনোমিয়াল
    • কে-নিয়ারেস্ট নেইবোরস
    • ক্লাসিফিকেশন এন্ড রিগ্রেশন ট্রি
    • র‍্যান্ডম ফরেস্ট
    • অ্যাডাপ্টিভ বুস্টিং
    • গ্রাডিয়েন্ট বুস্টিং
    • এক্সট্রিম গ্রাডিয়েন্ট বুস্টিং
    • সাপোর্ট ভেক্টর মেশিন
    • কে ফোল্ড ক্রস ভ্যালেইডেশন
  • আনসুপারভাইজড লার্নিং
    • কে-মিনস ক্লাস্টারিং
    • হায়ারার্কিক্যাল ক্লাস্টারিং
    • অ্যাসোসিয়েশন রুলসঃ অ্যাপ্রিওরি অ্যালগরিদম
    • প্রিন্সিপাল কম্পোনেন্ট এনালাইসিস এবং ডাইমেনশনালিটি রিডাকশন
  • রিইনফোর্সমেন্ট লার্নিং
  • সংযুক্তি
    • জেড টেবিল
    • টি টেবিল
    • স্টাডি রিসোর্স
    • চিট শিট
Powered by GitBook
On this page

Was this helpful?

  1. পরিসংখ্যানের সাথে পরিচয়

ইম্পিরিক্যাল ল অব ডিস্ট্রিবিউশন

"If the first words fail, ten thousand will then not avail" -- Ancient Chinese Proverb

Previousকোভ্যারিয়্যান্স এবং কোরিলেশনNextপরিসংখ্যান ল্যাব-১ঃ বেসিক পরিসংখ্যান

Last updated 4 years ago

Was this helpful?

বাস্তব জীবনের ডেটার চেহারা হরেক রকমের হতে পারে। তবে কখনো কখনও ডেটার চেহারা অনেকটা ঘন্টা বা বেল শেপের মত হয়ে থাকে।প্রকৃতিতে বালির ঢিবি বা পাহাড়ের আকৃতিও অনেকটা এই বেল শেপের মত। ডেটাকে ডেটার ডস্ট্রিবিউশন প্লটের চেহারা যদি এরকম বেল শেপের মত হয়ে থাকে তখন তাহে নরমাল ডিস্ট্রিবিউশন বলে।

পারফেক্ট নরমাল ডিস্ট্রিবিউশনে ডেটার মিন, মোড এবং মিডিয়ান ঠিক মাঝামাঝি এবং সবার মান সমান হয়ে থাকে। ডিস্ট্রিবিউশনে দুই পাশে ৫০% করে ডেটা থাকে অর্থাৎ ডেটার ডিস্ট্রিবিউশন হয় সিমেট্রিক।

বাস্তব জীবনে নরমাল ডিস্ট্রিবিউশনের কিছু উদাহরন,

  • সদ্য জন্ম নেয়া শিশুর ওজন

  • ইনকাম ডিস্ট্রিবিউশন

  • মানুষের উচ্চতা

  • আইকিউ

  • রক্তচাপ

  • পরিক্ষার ফলাফল

  • কোন মেজারমেন্টের এররের পরিমান

ইম্পিরিক্যাল ল অব ডিস্ট্রিবিউশন

নরমাল ডিস্ট্রিবিউশনের ভেতর চমৎকার একটি বিষয় আছে এটাকে বলা হয় ইম্পিরিক্যাল ল অব ডিস্ট্রিবিউশন। কোন নরমাল ডিস্ট্রিবিউশনের ৬৮% ডেটা স্ট্যান্ডার্ড ডেভিয়েশন ১ এর ভেতরেই অবস্থান করে। ৯৫% ডেটা স্ট্যান্ডার্ড ডেভিয়েশন ২ এর ভেতরে অবস্থান করে এবং ৯৭.৭ % ডেটা স্ট্যান্ডার্ড ডেভিয়েশন ৩ এর ভেতরে অবস্থান করে।

Skewness

নরমাল ডিস্ট্রিবিউশনের ডেটা সিমেট্রিক হয়ে থাকে অর্থাৎ দুপাশে সমান পরিমান ডেটা থাকে । যখন কোন কার্ভ কিছুটা ডানে বা বামে সরে যায় সেটা আর সিমেট্রিক থাকে না, এধরনের কার্ভকে বলে অ্যাসিমেট্রিক । কোন ডিস্ট্রিবিউশন কার্ভ কতখানি অ্যাসিমেট্রিক সেটার পরিমাপই হচ্ছে স্কিউনেস। কার্ভ যদি নরমাল কার্ভের তুলনায় ডানে ঝুকে যায় তখন সেটাকে বলা হয় নেগেটিভ স্কিউড কার্ভ , আবার কার্ভ যদি নরমাল কার্ভ থেকে বামে ঝুকে যায় সেটাকে বলা হয় পজিটিভ স্কিউড কার্ভ।

Skewness

Type

Skewness < 0

Negatively Skewed

Skewness = 0

No Skewed / Standard Normal

Skewness > 0

Positively Skewed

Kurtosis

কোন ডিস্ট্রিবিউশন সিমেট্রিক হওয়া সত্ত্বেও সূচালো বা কিছুটা ভোতা ধরনের হতে পারে। ডিস্ট্রিবুশন কার্ভের শেপ কতখানি সূচালো বা ভোতা সেতার পরিমাপকে কার্টোসিস বলে। কোন সিমেট্রিক ডিস্ট্রিবিউশন কার্ভ যদি সূচালো হয় তবে তাকে বলা হয় ল্যাপ্টোকার্টিক , আবার কার্ভ যদি ভোতা শেপের হয় তাকে বলা হয় প্লাটিকার্টিক । নরমাল শেপের কার্ভকে বলা হয় মেসোকার্টিক ।

Kurtosis

Type

Kurtosis < 0

Platykurtic

Kurtosis = 0

Mesokurtic

Kurtosis > 0

Leptokurtic

ছবি- নরমাল ডিস্ট্রিবিউশন (সূত্র-ইন্টারনেট)
ছবি - ইম্পিরিক্যাল ল অব ডিস্ট্রিবিউশন (সম্পাদিত)
ছবি- স্কিউনেস (সূত্র-ইন্টারনেট)
ছবি- কার্টোসিস (সূত্র-ইন্টারনেট)