ডাটা সাইন্সের হাতেখড়ি
  • ভূমিকা
  • লেখকের পরিচয়
  • বইটি যেভাবে পড়বেন
  • ডেটার সাথে পরিচয়
  • ডেটা সাইন্স কি ?
  • বুদ্ধিমান যন্ত্রের উত্থান পর্ব
  • ডেটা সাইন্স পাইপলাইন এবং ডোমেইন নলেজ
  • ডেটা সাইন্স টুল বক্স
  • পরিসংখ্যানের সাথে পরিচয়
    • পরিসংখ্যান কি ?
    • স্যাম্পলিং
    • কেন্দ্রীয় প্রবনতা
    • ডেটার বিস্তার
    • কোভ্যারিয়্যান্স এবং কোরিলেশন
    • ইম্পিরিক্যাল ল অব ডিস্ট্রিবিউশন
    • পরিসংখ্যান ল্যাব-১ঃ বেসিক পরিসংখ্যান
    • ইনফারেন্স ও এস্টিমেশন
    • হাইপোথিসিস টেস্টিং
  • প্রবাবিলিটি
    • প্রবাবিলিটির পরিচয়
    • বিভিন্ন ধরনের ইভেন্ট
    • প্রবাবিলিটি ট্রি
    • বেইজ থিওরাম
    • প্রবাবিলিটি ল্যাব -১ঃ বেসিক প্রবাবিলিটি
    • প্রবাবিলিটি ডিস্ট্রিবিউশন
    • প্রবাবিলিটি ল্যাব-২ঃ প্রবাবিলিটি ডিস্ট্রিবিউশন
  • লিনিয়ার অ্যালজেব্রা
  • ডেটা ক্লিনিং
  • ডেটা ট্রান্সফরমেশন
  • এক্সপ্লোরেটরি ডেটা এনালাইসিস
  • মেশিন লার্নিং এর সাথে পরিচয়
  • সুপারভাইজড লার্নিং
    • লিনিয়ার রিগ্রেশন
    • পলিনমিয়াল রিগ্রেশন
    • নেইভ বেইজ ক্লাসিফায়ার
    • লজিস্টিক রিগ্রেশনঃ বাইনোমিয়াল
    • লজিস্টিক রিগ্রেশনঃ মাল্টিনোমিয়াল
    • কে-নিয়ারেস্ট নেইবোরস
    • ক্লাসিফিকেশন এন্ড রিগ্রেশন ট্রি
    • র‍্যান্ডম ফরেস্ট
    • অ্যাডাপ্টিভ বুস্টিং
    • গ্রাডিয়েন্ট বুস্টিং
    • এক্সট্রিম গ্রাডিয়েন্ট বুস্টিং
    • সাপোর্ট ভেক্টর মেশিন
    • কে ফোল্ড ক্রস ভ্যালেইডেশন
  • আনসুপারভাইজড লার্নিং
    • কে-মিনস ক্লাস্টারিং
    • হায়ারার্কিক্যাল ক্লাস্টারিং
    • অ্যাসোসিয়েশন রুলসঃ অ্যাপ্রিওরি অ্যালগরিদম
    • প্রিন্সিপাল কম্পোনেন্ট এনালাইসিস এবং ডাইমেনশনালিটি রিডাকশন
  • রিইনফোর্সমেন্ট লার্নিং
  • সংযুক্তি
    • জেড টেবিল
    • টি টেবিল
    • স্টাডি রিসোর্স
    • চিট শিট
Powered by GitBook
On this page

Was this helpful?

  1. পরিসংখ্যানের সাথে পরিচয়

পরিসংখ্যান কি ?

“Silence is the language of god, all else is poor translation.”― Mawlana Jalal-al-Din Rumi

Previousপরিসংখ্যানের সাথে পরিচয়Nextস্যাম্পলিং

Last updated 4 years ago

Was this helpful?

পরিসংখ্যান

“Statistics is the study of the collection, organization, analysis, interpretation, and presentation of data.”

ডেটা সাইন্সের অন্যতম অংশ হোল পরিসংখ্যান বা স্ট্যাটিস্টিক্স । পরিসংখ্যানকে ভিত্তি করেই মূলত গড়ে উঠেছে ডেটা সাইন্স , মেশিন লার্নিং পথচলা। তাই মেশিন লার্নিং শেখার আগে আমরা পরিসংখ্যানের মৌলিক কিছু ধারনার সাথে পরিচিত হয়ে নেবো।

পরিসংখ্যান হোল ডেটা বা উপাত্ত সংগ্রহ, বিশ্লেষণ, ব্যাখ্যা ও পরিবেশন সম্পর্কিত বিজ্ঞান। এসএসসি পরীক্ষায় পাশের হার ৮৬% বা বাংলাদেশের মোবাইল ফোন ব্যবহারকারীর সংখ্যা ১৫৭.৫৪৪ মিলিয়ন এগুলো সবই হোল পরিসংখ্যান। পরিসংখ্যানের ভিত্তি হোল উপাত্ত বা ডেটা । ডেটা ছাড়া কোন পরিসংখ্যানই সম্ভব নয়।

পরিসংখ্যানের প্রকারভেদ,

  • Descriptive statistics- Descriptive statistics বা বর্ণনামূলক পরিসংখ্যানের মাধ্যমে উপাত্তকে বর্ণনা করা হয়।

  • Inferential statistics-Inferential statistics বা সিদ্ধান্তমূলক পরিসংখ্যানের মাধ্যমে প্রকল্পের পরীক্ষণের (Test of hypothesis) মাধ্যমে সিদ্ধান্ত গ্রহনে (decision making) সহায়তা করা হয়।

পরিসংখ্যানে ব্যবহৃত উপাত্ত বা ডেটা দুই ধরনের হতে পারে,

  • প্রাইমারি ডেটা - পরিসংখ্যানকারি যখন নিজেই বা নিজস্ব টিমের মাধ্যমে উপাত্ত/ডেটা সংগ্রহ করে সেটাকে প্রাইমারি ডাটা বলে।

  • সেকেন্ডারি ডেটা- সেকেন্ডারি ডাটা হোল অন্য কোন সোর্স থেকে সংগ্রহীত ডেটা । সেকেন্ডারি ডেটা পরিসংখ্যানকারি নিজে সংগ্রহ করে না , বরং অন্য কোন পরিসংখ্যান বা উৎস থেকে গ্রহন করে। সেকেন্ডারি ডেটার সোর্স বা উৎস সবসময় উল্লেখ করতে হয়।

পরিসংখ্যান পদ্ধতি

কোন বিষয়ের উপর সামগ্রিক পরিসংখ্যান পদ্ধতি কিছু সুনির্দিষ্ট ধাপে সম্পন্ন হয়। গবেষণার বিষয়বস্তুর উপর নির্ভর করে সমস্যাটি চিহ্নিত করার মাধ্যমেই এই প্রক্রিয়ার প্রথম ধাপের সূচনা হয়। পর্যায়ক্রমে পপুলেশন/ জনগোষ্ঠী নির্দিষ্ট করা, পপুলেশন থেকে স্যাম্পল বাছাই করা, উপাত্ত সংগ্রহ করা (সার্ভে/ জরিপ বা অন্য কোন উপায়ে) , উপাত্তকে বিশ্লেষণ ও বর্ণনা করা , গবেষণায় উল্লেখিত সমস্যা সমাধানের জন্য কোন পরিসংখ্যান পদ্ধতির মাধ্যমে উপাত্তকে ব্যবহার করা এবং প্রাপ্ত ফলাফলকে প্রকাশ করা।

পপুলেশন এবং স্যম্পল

ধরুন বাজারে গিয়েছেন বড়ই কিনতে। ঝুরি থেকে কয়েকটি বড়ই তুলে খেয়ে দেখলেন বড়ইয়ের স্বাদ টক না মিষ্টি , সেটা জানার জন্য। এখানে ঝুড়ির সব বড়ই হচ্ছে পপুলেশন বা জনগোষ্ঠী, আর যে বড়ই খেয়ে দেখা হয়েছে বড়ইয়ের স্বাদ জানার জন্য ,সেগুলো হোল স্যাম্পল বা নমুনা। যে বিষয়ে পরিসংখ্যান করা হবে তার সকল সদস্যকে একত্রে পপুলেশন বলে, আর পপুলেশনের প্রতিনিধি স্বরূপ যে অংশটিকে বাছাই করা হয় সেটি হচ্ছে নমুনা বা স্যাম্পল।

ছবি - পরিসংখ্যান এবং মেশিন লার্নিং বিষয়ক একটি কার্টুন ( সূত্র - ইন্টারনেট )
ছবি- পরিসংখ্যান পদ্ধতি
ছবি - পপুলেশন এবং স্যাম্পল ( সম্পাদিত )