এক প্যাকেজে সবকিছু, জুপিটার এবং কোলাব নোটবুক
মেশিন লার্নিং এর হাজারো প্যাকেজ। মানলাম। বললেন আপনি। তবে, শুরুতে কী দরকার?
মেশিন লার্নিং এর বেশকিছু টুলসগুলো নিয়ে আলাপ করার আগে একটা বিষয়ে আশ্বস্ত করতে চাই সবাইকে। মেশিন লার্নিং এর পাশাপাশি ডাটা সাইন্সের বিভিন্ন টুলসগুলোর পপুলারিটি বাড়তে থাকায় কেউ কেউ ওই দরকারি সব ওপেনসোর্স প্যাকেজগুলোকে এক জায়গায় নিয়ে এসেছেন। মানে, বুঝতেই পারছেন উইন্ডোজে এক ক্লিকে ইনস্টল! আমি লিনাক্স ব্যবহার করি বলে বলতে পারি - সেখানেও জিনিসটা চলে এসেছে পানির পর্যায়ে।
পাইথনে মেশিন লার্নিং নিয়ে কাজ করলে সবাই শুরু করে 'সাইকিট-লার্ন' দিয়ে। আসলেই তাই। অসাধারণ মেশিন লার্নিং লাইব্রেরি। ডকুমেন্টেশনও অন্য লেভেলের। এই জিনিসটা আবার আরো দুটো পাইথন প্যাকেজের ওপর ভর করে চলে। তার একটা হচ্ছে 'নামপাই', আরেকটা 'সাইপাই'। মানুষ আবার ছবি ছাড়া কিছু বোঝে না। সেই 'স্টানিং' ভিজ্যুয়ালাইজেশনের জন্য আমরা ব্যবহার করবো 'ম্যাটপ্লটলিব'। ডাটাকে খুঁচিয়ে দেখতে 'পান্ডাজ' এর জুড়ি নেই। ডাটা অ্যানালাইসিস করতে লাগবে একে। তো, আমাদের ইন্টারফেস কি হবে? 'আই-পাইথন' ছাড়া আর কে? 'ইন্টার-অ্যাক্টিভ' মানে দেখে দেখে কাজ করার জন্য 'জুপিটার নোটবুক' ছাড়া আমরা অচল। পাইথন তো আছেই। তো, এই আটটা টুল সহ আরো হাজারো ডাটা সাইন্স টুল পাবো কোথায়?
বলবো? আচ্ছা বলছি। চা পাওনা রইলো কিন্তু!
আমার পছন্দ অ্যানাকন্ডা। মানে পাইথনের বড় ভাই। এই ডিস্ট্রিবিউশনটা তৈরি করা হয়েছে বিশাল স্কেলের ডাটা প্রসেসিং, প্রেডিক্টিভ অ্যানালাইসিস আর দরকারি সাইন্টিফিক কম্পিউটিং এর জন্য। দুটো ডিস্ট্রবিউশনে ইন্টেলের কমার্শিয়াল 'এমকেএল' লাইব্রেরি আছে - ফ্রী! 'সাইকিট-লার্ন' এর মেশিন লার্নিং অ্যালগরিদমগুলোর গতি এনে দেয় এই জিনিস।
পরের পছন্দ এন-থটের ক্যানোপি। এর ইনস্টলারটা অন্য লেভেলের।
এখন চলুন ইনস্টল করে নেই অ্যানাকন্ডা ডাটা সাইন্স ডিস্ট্রিবিউশন প্যাকেজ। পাওয়া যাবে নিচের লিংকে।
https://www.anaconda.com/download/
১. উইন্ডোজ ব্যবহারকারীদের জন্য ইনস্টলারটা খুবই সহজ। ডাউনলোড করে ডাবল ক্লিক করে ইনস্টলারটা চালু করুন।
২. লাইসেন্স টার্ম মেনে নিন। নেক্সট চাপুন।
৩. ইনস্টলেশন ডিরেক্টরি বেছে নিন। সতর্কতাবাণী হচ্ছে, অনুগ্রহ করে কোন স্পেস বা 'ইউনিকোড ক্যারেক্টার' রাখবেন না। না মানে না। বাংলা ইউনিকোড ক্যারেক্টার।
৪. আমাদের এই ইনস্টলেশনে 'অ্যাডমিনিস্ট্রেটিভ প্রিভিলেজ' লাগে না।
৫. অ্যানাকন্ডাকে কোন পাথ এনভায়রনমেন্টে যোগ করার দরকার নেই। যোগ করলেই সমস্যা বাড়ে। অ্যানাকন্ডা আপডেট বা অন্যান্য কিছু করতে চাইলে স্টার্ট মেন্যু থেকে অ্যানাকন্ডা নেভিগেটর বা অ্যানাকন্ডা প্রম্প্ট দিয়ে কাজ করতে পারেন।
৬. "রেজিস্টার অ্যানাকন্ডা অ্যাজ মাই ডিফল্ট পাইথন ৩.৬" চেকবক্সটি দয়া করে আনচেক করবেন না। ডিফল্ট চেক মেনে নিন।
৭. 'মাইক্রোসফট ভিজ্যুয়াল ষ্টুডিও কোড' ইনস্টল করার দরকার নেই। ইনস্টল করতে চাইলে ইন্টারনেট আর 'অ্যাডমিনিস্ট্রেটিভ প্রিভিলেজ' লাগবে।
৮. নেক্সট, নেক্সট এর পর 'ফিনিশ' বাটন চাপ দিয়ে ইনস্টলেশন শেষ করে দিন। ইনস্টলেশন শেষে উইন্ডোজ স্টার্ট মেন্যুতে গিয়ে 'অ্যানাকন্ডা নেভিগেটর' দেখতে পারেন। অসাধারণ সব জিনিসপত্র। আমাদের লাগবে না এমুহুর্তে।
৯. সার্চ বক্সে লিখুন Anaconda Navigator, পুরো লিখতে হবে না। চলে আসবে আমাদের নেভিগেটর।
১০. চাইলে 'আর-ষ্টুডিও' ইনস্টল করে নিতে পারেন এই নেভিগেটরে। ভয় পাবেন না যেকোন কিছু চেষ্টা করতে। আপনার পিসি তো বাঘ ভালুক না, যে ভুল হলে খেতে আসবে।
আমি যেহেতু প্রচুর ট্রাভেল করি, সেখানে ইন্টারনেট সহ একটা ব্রাউজার হলেই যথেষ্ট। ঠিক ধরেছেন। আমি গুগল রিসার্চ এর "কোলাব" এর কথা বলছিলাম। গত বছরে গুগল রিসার্চ নিয়ে এসেছে ক্লাউডে তাদের ভার্চুয়াল মেশিন, সঙ্গে গুগল কোলাবোরেটরি নোটবুক, কোলাব। ১৩ গিগাবাইট RAM, ৩৫০ গিগাবাইট অনলাইন হার্ডড্রাইভ, কয়েক হাজার ডলারের NVIDIA Tesla K80 জিপিইউ, এটাতো আমার বাসাতেই নেই।
গুগল ড্রাইভে থাকবে আপনার নোটবুক। লোড করতে পারেন গিটহাব থেকে। আপনার ব্রাউজার পয়েন্ট করুন colab.research.google.com এ।
Last updated