৬.৫. "আর" স্টুডিওতে ডাটা লোড
Last updated
Last updated
তো, বসে আছি কেন আমরা? আমাদের হাতে কিন্তু চলে এসেছে সব ডাটা। মনে আছে ৩.৩ সেকশনের কথা? আমরা কিন্তু সবই ডাউনলোড করেছি প্রয়োজন মতো। আর সে সব ডাউনলোড করে রেখেছি আমাদের ওয়ার্কিং ডাইরেক্টরিতে। মনে আছে তো আমাদের ওয়ার্কিং ডাইরেক্টরিটার কথা?
১. প্রজেক্ট টাইটানিকের ওয়ার্কিং ডাইরেক্টরি = "Documents\datasets\titanic" ।
২. স্ক্রিপ্ট ডাউনলোড = সাইট "গিটহাব" https://github.com/raqueeb/mltraining/>; ক্লোন করে ডাউনলোড > আনজিপ > ML-workbookএর সব ফাইল
৩. ডাটাসেট ডাউনলোড = সাইট ক্যাগল = train.csv এবং test.csv
৪. সব ডাটা ফেলতে হবে ওয়ার্কিং ডিরেক্টরিতে
১. চালু করি "আর" ষ্টুডিও। ‘আর’ এর কনসোলে কাজ করলেও, আমরা শুরুতেই লোড করে নেব আমাদের "আর" স্ক্রিপ্ট - গিটহাব থেকে। "আর" স্টুডিওতে ক্লিক করি file → open file, চলে যাই আমাদের ওয়ার্কিং ডাইরেক্টরীতে। সিলেক্ট করি আমাদের প্রথম স্ক্রিপ্ট ফাইল।
"আর" ষ্টুডিওর টেক্সট এডিটরে এসেছে আমাদের নতুন স্ক্রিপ্ট। ভালো করে লক্ষ্য করুন প্রতিটা লাইন।
যেকোনো প্রোগ্রামিং এনভায়রনমেন্টের জন্য, কাজ করতে গেলেই প্রথমে লাগে সে সম্পর্কিত ডাটা। এখানেও আমরা প্রথমেই লোড করে নিচ্ছি সেই সম্পর্কিত ডাটাগুলো। ক্যাগল থেকে। মানে, আমাদের টাইটানিক ফোল্ডার থেকে। ছবি: "আর" স্টুডিওর প্রথম স্ক্রিপ্ট
উইন্ডোজের অনেক এপ্লিকেশনএর মতো "আর" স্টুডিওর শুরুর দিকে বেশ কিছু "ফাংশন" প্রোগ্রামটার মেন্যু দিয়ে করা যায়। উইন্ডোজ মানে সব মেন্যু বেসড। কিন্তু মেন্যুর পাশাপাশি কমান্ড লাইন চলে দরকার মতো। এখানে আমার প্রস্তাবনা একটু ভিন্ন। মেন্যু দিয়ে যে কাজগুলো করা যায় - সেগুলো কমান্ড লাইনেও সম্ভব। আমরা শুরু থেকে কমান্ড লাইনে কাজ করলে, স্ক্রিপ্টিং এর জন্য সেটা সুবিধাজনক। প্রথমে, আমাদেরকে সেট করতে হবে আমাদের ওয়ার্কিং ডাইরেক্টরি। সেটা করা সম্ভব মেনু থেকে।
ছবি: সেট করতে হবে ওয়ার্কিং ডাইরেক্টরি
২. ক্যাগল সাইট থেকে পাওয়া আমাদের ডাটাগুলোকে ইমপোর্ট করতে হবে আমাদের আর স্টুডিওতে। বিভিন্ন ডাটাসেটকে ইমপোর্ট করার ছবি দেয়া হলো নিচে। সুবিধার জন্য আবারো বলছি - আমাদের ডাটাগুলো আছে "CSV" 'কমা সেপারেটেড ভ্যালু' ফাইলে। এই ফাইলের সবকিছু দেয়া আছে আসল "কমা" "কমা" দিয়ে। দেখতে পারেন আমাদের নোটপ্যাড দিয়ে খুলে। এই ফাইল খুলবে এক্সেল দিয়ে। "সিএসভি" খুব কমন ফরম্যাট। পৃথিবীর প্রায় সব প্রোগ্রামই সাপোর্ট করে এই জিনিস।
ছবি: ডাটাগুলোকে ইমপোর্ট করতে হবে "আর" স্টুডিওতে