৬.৫. "আর" স্টুডিওতে ডাটা লোড

"আর" স্টুডিওতে ডাটা লোড

তো, বসে আছি কেন আমরা? আমাদের হাতে কিন্তু চলে এসেছে সব ডাটা। মনে আছে ৩.৩ সেকশনের কথা? আমরা কিন্তু সবই ডাউনলোড করেছি প্রয়োজন মতো। আর সে সব ডাউনলোড করে রেখেছি আমাদের ওয়ার্কিং ডাইরেক্টরিতে। মনে আছে তো আমাদের ওয়ার্কিং ডাইরেক্টরিটার কথা?

চেক লিস্ট

১. প্রজেক্ট টাইটানিকের ওয়ার্কিং ডাইরেক্টরি = "Documents\datasets\titanic" ।

২. স্ক্রিপ্ট ডাউনলোড = সাইট "গিটহাব" https://github.com/raqueeb/mltraining/>arrow-up-right; ক্লোন করে ডাউনলোড > আনজিপ > ML-workbookএর সব ফাইল

৩. ডাটাসেট ডাউনলোড = সাইট ক্যাগল = train.csv এবং test.csv

৪. সব ডাটা ফেলতে হবে ওয়ার্কিং ডিরেক্টরিতে

"আর" ষ্টুডিও

১. চালু করি "আর" ষ্টুডিও। ‘আর’ এর কনসোলে কাজ করলেও, আমরা শুরুতেই লোড করে নেব আমাদের "আর" স্ক্রিপ্ট - গিটহাব থেকে। "আর" স্টুডিওতে ক্লিক করি file → open file, চলে যাই আমাদের ওয়ার্কিং ডাইরেক্টরীতে। সিলেক্ট করি আমাদের প্রথম স্ক্রিপ্ট ফাইল।

"আর" ষ্টুডিওর টেক্সট এডিটরে এসেছে আমাদের নতুন স্ক্রিপ্ট। ভালো করে লক্ষ্য করুন প্রতিটা লাইন।

যেকোনো প্রোগ্রামিং এনভায়রনমেন্টের জন্য, কাজ করতে গেলেই প্রথমে লাগে সে সম্পর্কিত ডাটা। এখানেও আমরা প্রথমেই লোড করে নিচ্ছি সেই সম্পর্কিত ডাটাগুলো। ক্যাগল থেকে। মানে, আমাদের টাইটানিক ফোল্ডার থেকে। ছবি: "আর" স্টুডিওর প্রথম স্ক্রিপ্ট

উইন্ডোজের অনেক এপ্লিকেশনএর মতো "আর" স্টুডিওর শুরুর দিকে বেশ কিছু "ফাংশন" প্রোগ্রামটার মেন্যু দিয়ে করা যায়। উইন্ডোজ মানে সব মেন্যু বেসড। কিন্তু মেন্যুর পাশাপাশি কমান্ড লাইন চলে দরকার মতো। এখানে আমার প্রস্তাবনা একটু ভিন্ন। মেন্যু দিয়ে যে কাজগুলো করা যায় - সেগুলো কমান্ড লাইনেও সম্ভব। আমরা শুরু থেকে কমান্ড লাইনে কাজ করলে, স্ক্রিপ্টিং এর জন্য সেটা সুবিধাজনক। প্রথমে, আমাদেরকে সেট করতে হবে আমাদের ওয়ার্কিং ডাইরেক্টরি। সেটা করা সম্ভব মেনু থেকে।

ছবি: সেট করতে হবে ওয়ার্কিং ডাইরেক্টরি

২. ক্যাগল সাইট থেকে পাওয়া আমাদের ডাটাগুলোকে ইমপোর্ট করতে হবে আমাদের আর স্টুডিওতে। বিভিন্ন ডাটাসেটকে ইমপোর্ট করার ছবি দেয়া হলো নিচে। সুবিধার জন্য আবারো বলছি - আমাদের ডাটাগুলো আছে "CSV" 'কমা সেপারেটেড ভ্যালু' ফাইলে। এই ফাইলের সবকিছু দেয়া আছে আসল "কমা" "কমা" দিয়ে। দেখতে পারেন আমাদের নোটপ্যাড দিয়ে খুলে। এই ফাইল খুলবে এক্সেল দিয়ে। "সিএসভি" খুব কমন ফরম্যাট। পৃথিবীর প্রায় সব প্রোগ্রামই সাপোর্ট করে এই জিনিস।

ছবি: ডাটাগুলোকে ইমপোর্ট করতে হবে "আর" স্টুডিওতে

Last updated