৫.৩. প্রজেক্ট টাইটানিক + 'আর' ষ্টুডিও

প্রজেক্ট টাইটানিক + 'আর' ষ্টুডিও

“আর ষ্টুডিও” দেখানো শেষ, এখন প্রজেক্ট টাইটানিককে চালানোর জন্য তৈরি করতে হবে পুরো জিনিস। আগেই বলেছিলাম আর ষ্টুডিও স্ক্রিপ্ট এডিটরটা খুব কাজের। আর সে কারণে আপনাদের টাইপ করতে হবে না একটাও কম্যান্ড।

প্রতিটা কম্যান্ড দিয়ে তৈরি করে দিয়েছি একেকটা আর স্ক্রিপ্ট। খালি লোড করবেন আর চালাবেন। ভালো না লাগলে এডিট করবেন আমাদের দেয়া স্ক্রিপ্ট - তারপর চালিয়ে দেখবেন কতোটা ইম্প্রুভ করেছে আগের স্ক্রিপ্ট থেকে। যাদের ইন্টারনেট নেই, তাদের জন্য বইয়ের সাথে দেয়া যেতে পারে স্ক্রিপ্ট, তবে সেটা খুব একটা সুবিধার হবে না। কারণ, সময় সময় পাল্টাবে এই স্ক্রিপ্ট। আপডেট করবো আপনার সুবিধার কথা চিন্তা করে। কি হবে তখন? আর তাই আমরা যাবো "গিটহাবে"। স্ক্রিপ্ট ডাউনলোড করতে। কয়েক কিলোবাইটের স্ক্রিপ্ট। "জিপ" ফরম্যাটে।

আমি ধরে নিচ্ছি কিছুই জানেন না ‘আর এনভায়রনমেন্টে’। সেটাই স্বাভাবিক। আর তাই এখন থেকে সবকিছু চলবে সংখ্যা দিয়ে। প্রতিটা সংখ্যা ধরে ধরে কাজ করবেন - একসময় বুঝে যাবেন কি হচ্ছে এখানে।

স্ক্রিপ্ট ডাউনলোড - গিটহাব

১. চালু করুন ইন্টারনেট, ব্রাউজার পয়েন্ট করুন https://github.com/raqueeb/mltraining তে।

২. দেখুন সবচেয়ে ডান পাশে। ক্লিক করুন “ক্লোন অর ডাউনলোড” বাটনে। অপশন দেবে “ডাউনলোড জিপ” হিসেবে। ক্লিক করুন। পুরো স্ক্রিপ্টগুলো “জিপ” হয়ে ডাউনলোড হয়ে যাবে আপনার পিসিতে।

৩. এক্সট্র্যাক্ট করুন জিপ ফাইলটা। প্রথমে একটা ফোল্ডার পড়বে mltraining-master নামে। পুরো ফাইলটা এক্সট্র্যাক্ট করে চলে যান ML-workbook ফোল্ডারে। স্ক্রিপ্টগুলো আর এক্সটেনশনে। খুলে দেখুন ফাইলগুলো নোটপ্যাডে।

৪. আপনার উইন্ডোজ ৭/১০ পিসিতে চালু করুন ফাইল এক্সপ্লোরার। চলে যান আপনার ডকুমেন্ট ফোল্ডারে। তৈরি করুন C:\Users$test$\Documents\datasets\titanic ফোল্ডার। এখানে "টেস্ট" হচ্ছে আপনার পিসির ইউজারনেম। আসল কথা হচ্ছে - তৈরি করতে হবে টাইটানিক ফোল্ডার, ডাটাসেটস ফোল্ডারের মধ্যে। ছবি দিলে ভালো বোঝা যাবে এখানে।

৫. স্পেসিফিক ফোল্ডার দেবার দেবার দরকার ছিলো না। দিতে হলো দুটো কারণে। “আর স্টুডিও”র সাথে “পাথ” ঠিক রাখতে যেয়ে। যখন বুঝে যাবেন তখন ইচ্ছেমতো ফোল্ডার করবেন আপনি। আপনার পিসি, আপনার ফোল্ডার, স্বাধীনতা আপনার। এখন, অনুগ্রহ করে থাকবেন সাথে।

৬. মনে আছে ৩.এ বলা ML-workbook ফোল্ডারটার কথা? পুরো ফোল্ডারের ভেতরে যা কনটেন্ট আছে, সবগুলোকে কপি করে নিয়ে আসি আমাদের নতুন এই "টাইটানিক" ফোল্ডারে। মনে রাখবেন এখন থেকে যা রাখবো সব রাখবো এই ফোল্ডারে। "Documents\datasets\titanic" হচ্ছে আমাদের ওয়ার্কিং ডিরেক্টরি।

টাইটানিকের ডাটাসেট - সাইট ক্যাগল

৭. এখন আসি টাইটানিক এর জন্য আসল ডাটা ডাউনলোড করতে। সেই ডাটাগুলো ডাউনলোড করতে আমরা যাব ক্যাগল সাইটে। অ্যাকাউন্ট তৈরি করে ক্যাগল সাইট থেকে ডাটাগুলো ডাউনলোড করে আমরা রেখে দেবো আমাদের টাইটানিকের ওয়ার্কিং ডিরেক্টরিতে। ব্রাউজারে পয়েন্ট করি আমরা দুটো লিংকে।

ক. https://www.kaggle.com/c/titanic/download/train.csv

(এটা একটা "কমা সেপারেটেড ভ্যালু" ফাইল - এক্সেলে দেখা যাবে)

খ. https://www.kaggle.com/c/titanic/download/test.csv

ডাউনলোড করে রেখে দিন আমাদের টাইটানিকের ওই ফোল্ডারে। ওপরের দুটো লিংক কাজ না করলে সরাসরি চলে যাবেন https://www.kaggle.com/c/titanic/data লিংকে। সেখান থেকে সরাসরি ডাউনলোড করে নিন আপনার সময়ে।