পরিসংখ্যান কি ?

“Silence is the language of god, all else is poor translation.”― Mawlana Jalal-al-Din Rumi

পরিসংখ্যান

“Statistics is the study of the collection, organization, analysis, interpretation, and presentation of data.”
ডেটা সাইন্সের অন্যতম অংশ হোল পরিসংখ্যান বা স্ট্যাটিস্টিক্স । পরিসংখ্যানকে ভিত্তি করেই মূলত গড়ে উঠেছে ডেটা সাইন্স , মেশিন লার্নিং পথচলা। তাই মেশিন লার্নিং শেখার আগে আমরা পরিসংখ্যানের মৌলিক কিছু ধারনার সাথে পরিচিত হয়ে নেবো।
ছবি - পরিসংখ্যান এবং মেশিন লার্নিং বিষয়ক একটি কার্টুন ( সূত্র - ইন্টারনেট )
পরিসংখ্যান হোল ডেটা বা উপাত্ত সংগ্রহ, বিশ্লেষণ, ব্যাখ্যা ও পরিবেশন সম্পর্কিত বিজ্ঞান। এসএসসি পরীক্ষায় পাশের হার ৮৬% বা বাংলাদেশের মোবাইল ফোন ব্যবহারকারীর সংখ্যা ১৫৭.৫৪৪ মিলিয়ন এগুলো সবই হোল পরিসংখ্যান। পরিসংখ্যানের ভিত্তি হোল উপাত্ত বা ডেটা । ডেটা ছাড়া কোন পরিসংখ্যানই সম্ভব নয়।
পরিসংখ্যানের প্রকারভেদ,
  • Descriptive statistics- Descriptive statistics বা বর্ণনামূলক পরিসংখ্যানের মাধ্যমে উপাত্তকে বর্ণনা করা হয়।
  • Inferential statistics-Inferential statistics বা সিদ্ধান্তমূলক পরিসংখ্যানের মাধ্যমে প্রকল্পের পরীক্ষণের (Test of hypothesis) মাধ্যমে সিদ্ধান্ত গ্রহনে (decision making) সহায়তা করা হয়।
পরিসংখ্যানে ব্যবহৃত উপাত্ত বা ডেটা দুই ধরনের হতে পারে,
  • প্রাইমারি ডেটা - পরিসংখ্যানকারি যখন নিজেই বা নিজস্ব টিমের মাধ্যমে উপাত্ত/ডেটা সংগ্রহ করে সেটাকে প্রাইমারি ডাটা বলে।
  • সেকেন্ডারি ডেটা- সেকেন্ডারি ডাটা হোল অন্য কোন সোর্স থেকে সংগ্রহীত ডেটা । সেকেন্ডারি ডেটা পরিসংখ্যানকারি নিজে সংগ্রহ করে না , বরং অন্য কোন পরিসংখ্যান বা উৎস থেকে গ্রহন করে। সেকেন্ডারি ডেটার সোর্স বা উৎস সবসময় উল্লেখ করতে হয়।
পরিসংখ্যান পদ্ধতি
কোন বিষয়ের উপর সামগ্রিক পরিসংখ্যান পদ্ধতি কিছু সুনির্দিষ্ট ধাপে সম্পন্ন হয়। গবেষণার বিষয়বস্তুর উপর নির্ভর করে সমস্যাটি চিহ্নিত করার মাধ্যমেই এই প্রক্রিয়ার প্রথম ধাপের সূচনা হয়। পর্যায়ক্রমে পপুলেশন/ জনগোষ্ঠী নির্দিষ্ট করা, পপুলেশন থেকে স্যাম্পল বাছাই করা, উপাত্ত সংগ্রহ করা (সার্ভে/ জরিপ বা অন্য কোন উপায়ে) , উপাত্তকে বিশ্লেষণ ও বর্ণনা করা , গবেষণায় উল্লেখিত সমস্যা সমাধানের জন্য কোন পরিসংখ্যান পদ্ধতির মাধ্যমে উপাত্তকে ব্যবহার করা এবং প্রাপ্ত ফলাফলকে প্রকাশ করা।
ছবি- পরিসংখ্যান পদ্ধতি
পপুলেশন এবং স্যম্পল
ধরুন বাজারে গিয়েছেন বড়ই কিনতে। ঝুরি থেকে কয়েকটি বড়ই তুলে খেয়ে দেখলেন বড়ইয়ের স্বাদ টক না মিষ্টি , সেটা জানার জন্য। এখানে ঝুড়ির সব বড়ই হচ্ছে পপুলেশন বা জনগোষ্ঠী, আর যে বড়ই খেয়ে দেখা হয়েছে বড়ইয়ের স্বাদ জানার জন্য ,সেগুলো হোল স্যাম্পল বা নমুনা। যে বিষয়ে পরিসংখ্যান করা হবে তার সকল সদস্যকে একত্রে পপুলেশন বলে, আর পপুলেশনের প্রতিনিধি স্বরূপ যে অংশটিকে বাছাই করা হয় সেটি হচ্ছে নমুনা বা স্যাম্পল।
ছবি - পপুলেশন এবং স্যাম্পল ( সম্পাদিত )