৪.৫. মেশিন লার্নিং কমিউনিটি

Empowerment of individuals is a key part of what makes open source work, since in the end, innovations tend to come from small groups, not from large, structured efforts.

-- Tim O'Reilly

আমি ‘কমিউনিটি’র ক্ষমতায় বিশ্বাসী। এটাই দেখেছি আমি যুগে যুগে। আমি বিশ্বাস করি একদম ভেতর থেকে। এটাও দেখেছি কিভাবে কমিউনিটির সাহায্য নিয়ে তৈরি হয়েছে অনেক ‘স্ট্যাবল’ অপারেটিং সিস্টেম। কিভাবে দাঁড়িয়েছে বিভিন্ন সার্ভিসের বিজনেস মডেল। আজ আমি যা জানি, (যত অল্পই জানি) তার বেশিরভাগই এসেছে এই কমিউনিটি থেকে। আমাদের চোখের সামনে উত্থান দেখেছি ইউনিক্স আর লিনাক্স অপারেটিং সিস্টেমের। সঙ্গে অনেক এমবেডেড অপারেটিং সিস্টেমের। আজকে আমরা যত টুল ব্যবহার করি তার ৯০ শতাংশই এসেছে বিভিন্ন কমিউনিটি থেকে। সেখান থেকেই শুরু ‘ওপেন সোর্স’ মুভমেন্টের। বড় বড় বিজনেস সফটওয়্যার গুলোর হাতেখড়ি হয়েছে ওপেন সোর্স সফটওয়্যারগুলোর কোড দেখে। আমাদের গিটহাবেই আছে সেরকম লক্ষ লক্ষ ওপেন সোর্সভিত্তিক সফটওয়্যার।

কমিটির ক্ষমতা আমার প্রথম চোখে পড়ে আশি দশকের শেষের দিকে। ক্যাডেট কলেজে পড়তাম তখন। ছুটিতে আসলেই বসে যেতাম বুলেটিন বোর্ডএ। ৩০০ বিপিএস মোডেম। আজকের ফেইসবুক গ্রুপের মত তখন ছিল নিউজগ্রূপ। ‘অফলাইন ইন্টারনেটে’র ব্যাপারে আর নাইবা বললাম। এখনো মাঝেমধ্যে আমার সেই পোস্টগুলো দেখা যায় ইউনিক্স আর লিনাক্স ভিত্তিক নিউজগ্রূপ/ফোরামগুলোতে। হয়তোবা কাকুতি মিনতি করছি কিছু জিনিস জানতে। মজার ব্যাপার ছিল, উত্তর পেতাম প্রায় সঙ্গে সঙ্গেই। আমাদের সময় ওই সঙ্গে সঙ্গে ব্যাপারটার মানে পরের দিন। নিউজগুলো ক্যারি করত তখনকার সনাতন এনএনটিপি সার্ভারগুলো। সেটা ‘ইউইউসিপি’ প্রটোকলে রেপ্লিকেট হতো পুরো পৃথিবীতে।

ফিরে আসি আজকের কথায়। কেন ক্যাগল? মেশিন লার্নিংএর জন্য যদি একটা দুর্দান্ত কমিউনিটি থাকে তাহলে সেটা হচ্ছে ক্যগল। ক্যাগলের ক্ষমতা অন্য জায়গায়। তিন ধরনের কমিউনিটিকে সেবা দেয় ক্যাগল। বিনামূল্যে। বুদ্ধিমান গুগল এর ভবিষ্যৎ দেখে কিনে ফেলেছে পানির দরে। এটাকে কেনার পর ফান্ডিং নিয়ে চিন্তা নেই আর। গুগল চাইছে আরো মেশিন লার্নিং প্রকৌশলী তৈরি হোক সময়ের সাথে সাথে। পৃথিবীতে সমস্যা হাজারো। অনেক সমস্যা সমাধানে দরকার পড়ছে মেশিন লার্নিং। ব্যাপারটা কিছুটা আগের দিনের রিসার্চ কমিউনিটির মত। ইন্ডাস্ট্রি কথা বলতো অ্যাকাডেমিয়াদের সাথে। তাদের সমস্যা নিয়ে। সেই সমস্যা সমাধানের জন্য রিসার্চ করতেন ইউনিভার্সিটিগুলো। নামমাত্র খরচে সমস্যার সমাধান পেয়ে যেত ইন্ডাস্ট্রি।

সেই একই জিনিস ঘটছে মেশিন লার্নিং ইন্ডাস্ট্রিতে। ইন্ডাস্ট্রির সমস্যাগুলো জানাচ্ছে ক্যাগলে। সেই সমস্যাগুলোর উপর ভিত্তি করে ক্যাগল হোস্ট করছে অনেকগুলো কম্পিটিশন। এই প্রতিযোগিতাগুলো টার্গেট করা আছে তিন ধরনের কমিউনিটির জন্য। ১. নিজের মধ্যে জ্ঞান বাড়ানোর জন্য, কে কিভাবে সমস্যাটা সমাধান করছে সেটাকে ভিত্তি করে তৈরি হয় লিডারবোর্ড। অনলাইন গেমসের মতো। সেই সমস্যাটা কে কে ঠিকমত বুঝতে পারছে আর সেটাকে কিভাবে সমাধান করছে সেটা জানা যায় তাদের কোড দেখে। তখন ইন্ডাস্ট্রির সবাই চেনা শুরু করে এই প্রতিভাবান মানুষগুলোকে। আর চিনলে কি হয় সেটা জানেন সবাই।

২. ডাটা সাইন্সের বিভিন্ন প্রজেক্টে বিভিন্ন মানুষের কাজের কারুকাজ দেখে কোম্পানিগুলো খুঁজতে থাকে তাদের দরকারী প্রোগ্রামার। বিভিন্ন কোম্পানিও তখন জব পোস্ট করতে থাকে তাদের দরকারি মানুষের বিভিন্ন ধরনের ভ্যাকেন্সি দিয়ে। এই ক্যাগলে। প্রতিযোগিতাগুলোতে একেকজনের পারফরমেন্সের ওপর ভিত্তি করে কোম্পানিগুলো হায়ার করতে থাকে প্রতিভাবান মানুষগুলোকে।

৩. পুরস্কার। সমস্যা কোম্পানির। সমাধান আসে কমিউনিটি থেকে। পুরো জিনিসটাই চলে নলেজ বেসড ডিমান্ড আর সাপ্লাইয়ের ইকোসিস্টেম দিয়ে। আমি যদি একটা ফার্মসিটিক্যাল ইন্ডাস্ট্রি হই, যার বছরের টার্নওভার কয়েকশো বিলিয়ন ডলার - আমার তো সমস্যা থাকার কথা নয় কয়েকশো মিলিয়ন ডলার খরচ করতে। সমস্যা সমাধানে। তাই করছে ইন্ডাস্ট্রিগুলো। অফিসে বসিয়ে ডাটা সায়েন্টিস্টদের আলাদা বেতন না গুনে সমস্যা সমাধানে কমিউনিটি থেকে সমাধান নেয়া আর একটা চমকপ্রদ ব্যাপার। দিন শেষে শুধুমাত্র ডাটা টিউনিং করতে কয়েকজন ডাটা সায়েন্টিস্ট রাখলেই হলো অফিসে।