৩.৩. মেশিন লার্নিং এর কিছু ভাগ

Suppose you are providing solution to your kids for each and every situation in their life, it is called your kids are supervised. But, if your kids take their decisions out of their own understanding, it is called your kids are unsupervised.

-- Answer in Quora

শেখানোর ধারণায় মেশিন লার্নিংকে দুটো বড় ক্যাটাগরিতে ভাগ করা যায়। আমি আবারো বলছি - বড় দুটো ক্যাটাগরিতে।

১. “সুপারভাইজড” লার্নিং

২. “আন-সুপারভাইজড” লার্নিং

আগেও বলেছি মানুষ শেখে অভিজ্ঞতা থেকে। আমাদের মেশিন তো মানুষ থেকে আলাদা কিছু নয়। সেজন্য আমরা বলেছি - একটা সিস্টেম মানে মেশিনকে যদি শেখাতে হয়, তাহলে তার জন্য দরকার পুরনো অভিজ্ঞতা। আর মেশিনের জন্য পুরনো অভিজ্ঞতা হচ্ছে তার সম্পর্কিত ডাটা। এই ডাটা আবার দু'ধরনের হতে পারে। এক ধরণের ডাটা যাকে আমরা বলছি “লেবেলড” ডাটা, আরেক ধরনের ডাটা যেগুলো “লেবেলড” নয়।

লেবেলড ডাটা হচ্ছে - আপনার প্রশ্নের সাথে উত্তর দেয়া ডাটা। অর্থাৎ আপনার ডাটাকে লেবেল করা আছে উত্তরের সাথে। উত্তর কিন্তু “ক্লাসিফায়ার”। “ক্লাসিফাই” করা আছে “হ্যাঁ” অথবা “না” দিয়ে। ধরুন, আমাদের টাইটানিক প্রজেক্টের কথা। আমাদের জানতে হবে একজন যাত্রী - উনি বেঁচেছেন না মারা গিয়েছেন। আমাদের লেবেলড ডাটাসেটে “০” অথবা “১” দেয়া আছে। “০” মানে মারা গিয়েছেন। “১” মানে বেঁচে গিয়েছেন। একে আমরা বলছি “সুপারভাইজড” লার্নিং সিস্টেম। এটাই সবচেয়ে বেশি প্রচলিত সিস্টেম। আমাদের আশেপাশে সবকিছুই এই লার্নিং টেকনিকে চলছে। আমাদের বইটাও একেবারে “সুপারভাইজড” লার্নিংকে ঘিরে। আজকে যতো কাজ হচ্ছে মেশিন লার্নিংএ, তার প্রায় সবকিছু ঘটছে এই জিনিসকে ঘিরে।

“আন-সুপারভাইজড” লার্নিংএর কোন ‘লেবেলড’ ডাটা থাকে না। অর্থাৎ, শেখানোর মতো কোন ডাটা নেই। তার উত্তর আসে কিছুটা ক্লাস্টার হিসেবে। ক্লাস্টার মানে একটা গ্রূপ। বরং, সেই অ্যালগরিদম খুঁজে বের করে তার ভেতরে কোন লুকানো প্যাটার্ন আছে কি না। আমাদের সাধারণ কাজে এর ব্যবহার নেই বললেই চলে।