ডেটা সাইন্স টুল বক্স
Last updated
Last updated
ডেটা সাইন্সের জন্য একটু খোঁজ করলে নানান ধরনের প্রোগ্রামিং ল্যাংগুয়েজ এবং টুলস এর সন্ধান পেয়ে যাবেন। কিছু কিছু টুলস ব্যবহার করে প্রোগ্রামিং ছাড়াই ডেটা এনালাইসিস বা মেশিন লার্নিং করা যায়। মাইক্রসফট এক্সেল , র্যাপিড মাইনার, অরেঞ্জ, এসপিএসএস ইত্যাদি হচ্ছে এধরনের টুলস। এদের অধিকাংশই পেইড ভার্শন, তবে কিছু কিছু ট্রাইল বা ফ্রি এডিশনও রয়েছে। তবে বিষয় হচ্ছে এধরনের টুলস ব্যবহার করে আপনি চাইলেই সবধরনের সমস্যার সমাধান করতে পারবেন না, ধরুন আপনি নতুন কোন সফটওয়্যার তৈরি করতে চাচ্ছেন অথবা চলমান রয়েছে এমন কোন সফটওয়্যার বা সিস্টেমে মেশিন লার্নিং ফ্লেভার যুক্ত করতে চাচ্ছেন, এক্ষেত্রে আপনাকে অবশ্যই প্রোগ্রামিং ল্যাংগুয়েজের দিকে যেতে হবে। আর, পাইথন , জাভা এগুলো হচ্ছে ডেটা সাইন্সের জন্য জনপ্রিয় প্রোগ্রামিং ল্যাংগুয়েজ। তবে এগুলো ছাড়াও আরও অনেক প্রোগ্রামিং ল্যাংগুয়েজ দিয়েও ডেটা সাইন্সের কাজ করতে পারবেন।
কোন ভাষা ভালো আর কোন ভাষা ভালো না , সেই আলোচনায় আমরা যাবো না। আপনি চাইলে এদের যেকোনো একটি দিয়েই আপনার কাজ চালিয়ে নিতে পারবেন। তবে ডেটা সাইন্স বা মেশিন লার্নিং এর ক্ষেত্রে সবথেকে জনপ্রিয় হচ্ছে আর এবং পাইথন। পরিসংখ্যানবিদ দের কাছে আর একটি জনপ্রিয় প্রোগ্রামিং ল্যাংগুয়েজ, এই ভাষাটি ডেটা সাইন্সের ক্ষেত্রে অনেকটা পুরাতন এবং অনেক ফিচার যুক্ত। অপরদিকে পাইথন হচ্ছে দুনিয়ার সকল সমস্যার সমাধান ! পাইথনে করা যায়না এমন কাজ কমই আছে । পাইথন প্রতিনিয়ত ডেটা সাইন্সের জন্য দুর্দান্ত গতিতে সমৃদ্ধ হচ্ছে। আপনি যদি সফটওয়্যার বা এন্টারপ্রাইজ সলিউশনে যেতে চান তাহলে আপনাকে পাইথনেই বেছে নিতে হবে।
ডেটা সাইন্স নিয়ে কাজ করতে গেলে একজন ডেটা সাইন্টিস্টের কিছু উপকরন প্রয়োজন হয়। বিভিন্ন জন বিভিন্ন ধরনের টুলস ব্যবহার করে থাকে। অনেক কোম্পানি বা প্রতিষ্ঠান কিছু কিছু পেইড সফটওয়্যার ব্যবহার করেন, তবে বেশিরভাগ ফ্রি এবং ক্ষেত্রেই ওপেন সোর্স টুলস ব্যবহার করা হয়। এধরনের টুলসের রকমফের করা বেশ কষ্ট সাধ্য। জানলে অবাক হতে পারেন মাইক্রোসফট এক্সেল দ্বারাও ডেটা সাইন্সের অনেক জটিল জটিল সমস্যা খুব সহজেই সমাধান করা সম্ভব।
এই বইতে আমরা মূলত দেখবো পাইথন ব্যবহার করে কিভাবে ডেটা সাইন্স এর প্রয়োগ করা যায়। আর এর সবটাই আমরা দেখবো অ্যানাকোন্ডার মাধ্যমে।
অ্যানাকোন্ডা কি?
অ্যানাকোন্ডা একটি প্রোগ্রামিং আইডিই বা ইন্টিগ্রেটেড ডেভলপমেন্ট এনভারনমেন্ট যেখানে ডেটা সাইন্সের জন্য বিভিন্ন টুলস বিল্টইন হিসাবে দেয়া রয়েছে। এটি ব্যবহার করা তুলনামূলক ভাবে সহজ। অ্যাানাকন্ডায় জুপিটার নোটবুক, জুপিটার ল্যাব, আর স্টুডিও, অরেঞ্জ ইত্যাদি বিল্টইন হিসাবেই পেয়ে যাবেন। তবে এই বইতে আমরা জুপিটার নোটবুকের মাধ্যমে ডেটা সাইন্স শিখবো। অ্যানাকোন্ডার অফিশিয়াল ওয়েবসাইট (www.anaconda.com) থেকেই আমরা সেট আপ ফাইলটি ডাউনলোড করবো।
এরপর উইন্ডোজ অপারেটিং সিস্টেমের জন্য পাইথন ৩.৭ ভার্সন থেকে ৬৪ বিট ফাইলটি ডাউনলোড করুন।আপনার অপারেটিং সিস্টেম অনুযায়ী পৃথক বিটের সেটআপ ফাইল ডাউনলোড করতে পারেন। উইন্ডোজ ছাড়াও লিনাক্স বা ম্যাক অপারেটিং সিস্টেমের সেটআপ ফাইল এখান থেকেই ডাউনলোড করা যাবে। ডাউনলোড হওয়া সেটআপ ফাইলে ক্লিক করলে ইন্সটল উইন্ডো ওপেন হবে। এরপর পর্যায়ক্রমে নেক্সট বাটনে ক্লিক করার মাধ্যমে আমরা ইন্সটলেশন শেষ করবো।
মাইক্রোসফট ভিএস কোড ইন্সটল করার উইন্ডো আসলে স্কিপ বাটনে প্রেস করুন, আর যদি ইন্সটল করতে চান সেক্ষেত্রে ইন্সটল করতে পারবেন, তবে প্রাথমিক ভাবে এটি ব্যবহারের প্রয়োজন পরবে না।এরপরের উইন্ডোতে ফিনিস বাটনে প্রেস করুন। আপনার পিসি এখন ডেটা সাইন্স প্র্যাকটিস করার জন্য প্রস্তুত !!
অ্যানাকোন্ডা রান করার জন্য আপনার কম্পিউটারের স্টার্ট মেন্যুতে অ্যানাকোন্ডা নেভিগেটর আইকন পাবেন।
অ্যানাকোন্ডা ওপেন হলে অনেকগুলো টুলস পাওয়া যাবে। সবগুলোই ডেটা সাইন্স প্রজেক্টে ব্যবহার করা যায়। তবে এ পর্যায়ে আমরা জুপিটার নোটবুকের মাধ্যমেই আমাদের প্রজেক্টগুলো দেখবো।
অ্যানাকোন্ডায় বিল্টইন আর স্টুডিও দেয়া থাকে যার মাধ্যমে আর প্রোগ্রামিং ল্যাংগুয়েজের মাধ্যমে ডেটা সাইন্স এর বিভিন্ন প্রজেক্ট করা যাবে। এছাড়াও অরেঞ্জ হচ্ছে আরেকটি ভিজুয়াল প্রোগ্রামিং টুল , যার মাধ্যমে কোন প্রকার কোড না লিখেই ড্রাগ এন্ড ড্রপ পদ্ধতিতে ডেটা সাইন্সের বিভিন্ন সমস্যার সমাধান করা যায়। এজন্য এধরনের পদ্ধতিকে বলা হয় ভিজুয়াল প্রোগ্রামিং।
এই হচ্ছে জুপিটার নোটবুক। জুপিটার নোটবুককে বলা হয় ডেটা সাইন্সের জন্য গড গিফটেড টুলস। জুপিটার নোটবুকটি ওয়েব ব্রাউজারে ওপেন হবে।
জুপিটার নোটবুকে ফাইল ওপেন করলে এরকম উইন্ডো দেখতে পাবো। এখানেই আমাদের পাইথন কোড লিখতে হবে।ডেটা সাইন্স শেখার জন্য এনভায়রনমেন্ট সেটআপ দেয়া শেষ, এবার কোডিং করার পালা।
গুগোল কোল্যাব
গুগোল কো ল্যাবরেটরি বা কোল্যাব (https://colab.research.google.com/notebooks/intro.ipynb ) হচ্ছে জুপিটার নোটবুকের বিকল্প একটি ক্লাউড প্লাটফর্ম । আপনার যদি একটি জিমেইল একাউন্ট থাকে তাহলেই আপনি গুগোল কোল্যাব ব্যবহার করতে পারবেন। গুগোল কোল্যাব ব্যবহারের ক্ষেত্রে আপনার গুগোল ড্রাইভে " Colab Notebooks " নামের একটি ফোল্ডার ক্রিয়েট হবে সেখানেই আপনি জুপিটার নোটবুকের মত প্রোগ্রাম করতে পারবেন।
কোল্যাব এর সুবিধা হচ্ছে আপনি যাই কোড করবেন সেটাই Colab Notebooks ফোল্ডারে জমা থাকবে এবং যখন যেখানে খুশি সেখান থেকেই ক্লাউডে ডেটা সাইন্সের সব কাজ করতে পারবেন, আর ফাইল হারিয়ে যাবারও ভয় নেই !