# পরিসংখ্যান কি ?

## **পরিসংখ্যান**

“Statistics is the study of the collection, organization, analysis, interpretation, and presentation of data.”

&#x20;ডেটা সাইন্সের অন্যতম অংশ হোল পরিসংখ্যান বা স্ট্যাটিস্টিক্স । পরিসংখ্যানকে ভিত্তি করেই মূলত  গড়ে উঠেছে ডেটা সাইন্স , মেশিন লার্নিং পথচলা। তাই মেশিন লার্নিং শেখার আগে আমরা পরিসংখ্যানের মৌলিক কিছু ধারনার সাথে পরিচিত হয়ে নেবো।

![ছবি - পরিসংখ্যান এবং মেশিন লার্নিং বিষয়ক একটি কার্টুন ( সূত্র - ইন্টারনেট ) ](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-MAeA_zVQTDc1376hSkI%2F-MAeEWs7aa89Pvx759lC%2Fimage.png?alt=media\&token=54fc5586-bc4b-4be2-b2db-e696e2486f68)

&#x20;পরিসংখ্যান হোল ডেটা বা উপাত্ত সংগ্রহ,  বিশ্লেষণ, ব্যাখ্যা ও পরিবেশন সম্পর্কিত বিজ্ঞান। এসএসসি পরীক্ষায় পাশের হার ৮৬% বা বাংলাদেশের মোবাইল ফোন ব্যবহারকারীর সংখ্যা ১৫৭.৫৪৪ মিলিয়ন এগুলো সবই হোল পরিসংখ্যান।  পরিসংখ্যানের ভিত্তি হোল উপাত্ত বা ডেটা । ডেটা ছাড়া কোন পরিসংখ্যানই সম্ভব নয়।&#x20;

**পরিসংখ্যানের প্রকারভেদ,**

* **Descriptive statistics-** Descriptive statistics বা বর্ণনামূলক পরিসংখ্যানের মাধ্যমে উপাত্তকে  বর্ণনা করা হয়।
* **Inferential statistics-**&#x49;nferential statistics বা সিদ্ধান্তমূলক পরিসংখ্যানের মাধ্যমে প্রকল্পের পরীক্ষণের (Test of hypothesis)  মাধ্যমে সিদ্ধান্ত গ্রহনে (decision making) সহায়তা করা হয়।

পরিসংখ্যানে ব্যবহৃত উপাত্ত  বা ডেটা দুই ধরনের হতে পারে,

* **প্রাইমারি ডেটা -** পরিসংখ্যানকারি যখন নিজেই বা নিজস্ব টিমের মাধ্যমে উপাত্ত/ডেটা সংগ্রহ করে সেটাকে প্রাইমারি ডাটা বলে।
* **সেকেন্ডারি ডেটা**- সেকেন্ডারি ডাটা হোল অন্য কোন সোর্স থেকে সংগ্রহীত ডেটা । সেকেন্ডারি ডেটা পরিসংখ্যানকারি নিজে সংগ্রহ করে না , বরং অন্য কোন পরিসংখ্যান বা উৎস থেকে গ্রহন করে। সেকেন্ডারি ডেটার সোর্স বা উৎস সবসময় উল্লেখ করতে হয়।

**পরিসংখ্যান পদ্ধতি**

কোন বিষয়ের উপর সামগ্রিক পরিসংখ্যান পদ্ধতি কিছু সুনির্দিষ্ট ধাপে সম্পন্ন হয়। গবেষণার বিষয়বস্তুর উপর নির্ভর করে সমস্যাটি চিহ্নিত করার মাধ্যমেই এই প্রক্রিয়ার প্রথম ধাপের সূচনা হয়। পর্যায়ক্রমে পপুলেশন/ জনগোষ্ঠী নির্দিষ্ট করা, পপুলেশন থেকে স্যাম্পল বাছাই করা, উপাত্ত সংগ্রহ করা (সার্ভে/ জরিপ বা অন্য কোন উপায়ে) , উপাত্তকে বিশ্লেষণ ও বর্ণনা করা , গবেষণায় উল্লেখিত সমস্যা সমাধানের জন্য কোন পরিসংখ্যান পদ্ধতির মাধ্যমে উপাত্তকে ব্যবহার করা এবং প্রাপ্ত ফলাফলকে প্রকাশ করা।

![ছবি- পরিসংখ্যান পদ্ধতি](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M8eXuH4GSEJXdGgemNk%2F-M8eXyAroUspdGJnZTRy%2Fstat.PNG?alt=media\&token=ef77e51e-524c-4e5f-8f1e-c920e4f58046)

**পপুলেশন এবং স্যম্পল**

ধরুন বাজারে গিয়েছেন বড়ই কিনতে। ঝুরি থেকে কয়েকটি বড়ই তুলে খেয়ে দেখলেন  বড়ইয়ের স্বাদ টক না মিষ্টি , সেটা জানার জন্য। এখানে ঝুড়ির সব বড়ই হচ্ছে পপুলেশন বা জনগোষ্ঠী,  আর যে বড়ই খেয়ে দেখা হয়েছে বড়ইয়ের স্বাদ জানার জন্য ,সেগুলো হোল স্যাম্পল বা নমুনা। যে বিষয়ে পরিসংখ্যান করা হবে তার সকল সদস্যকে একত্রে পপুলেশন বলে, আর পপুলেশনের প্রতিনিধি স্বরূপ যে অংশটিকে বাছাই করা হয় সেটি হচ্ছে নমুনা বা স্যাম্পল।

![ছবি - পপুলেশন এবং স্যাম্পল ( সম্পাদিত )](https://3502995838-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-La_TEtDsP7G3fMoFiNl%2F-M8eXuH4GSEJXdGgemNk%2F-M8eY9iA-k79lXyJbQcd%2FpastedImage0.png?alt=media\&token=a2a0b244-2a44-48bd-8c4e-4ac8ab163e7d)
