শুরুর ঘটনা

এই বইটা থেকে কি আশা করছি?

There is no reason and no way that a human mind can keep up with an artificial intelligence machine by 2035.

—Gray Scott

বইটার নামই বলে দিচ্ছে এটা কোন 'পিএইচডি' রিসার্চ পেপার নয়। আমরা হাতেকলমে ডিপ লার্নিং জিনিসটা কিভাবে বুঝে প্রোডাক্শনে নেয়া যায় সেটা নিয়ে আলাপ করবো। ডিপ লার্নিং একটা নতুন বিষয়, এবং একারণে এব্যাপারে বেশ অংকভীতি কাজ করছে। আমি সেই জায়গা থেকে কিছুটা সরে এসে ব্যবহারিক বিষয় নিয়েই গল্প করবো বেশি। যখন অংক লাগবে সে জায়গাগুলোতে আমার আলাপ সহজ হবে। আগের বইটাতেও এধরণের কিছু লিখেছিলাম।

বাজারে প্রচুর ইংরেজি বই আছে যেগুলো কম্পিউটার সাইন্সের গ্রাজুয়েট বা পিএইচডি স্টুডেন্টদেরকে টার্গেট করে লিখা। অনেক অ্যাডভান্সড ম্যাথ দেয়া আছে সেখানে। আমার সেখানে কোন সমস্যা নেই। আমার কথা অন্য। আজ পর্যন্ত যতো অ্যাডভান্সড মেশিন লার্নিং অ্যালগরিদম এসেছে সেগুলোকে কমার্শিয়াল অথবা রিসার্চ অ্যাপ্লিকেশনে আনতে সেই জ্ঞানের তেমন প্রয়োজন নেই। এছাড়াও গুগল, অ্যামাজন, নেটফ্লিক্স, ফেসবুকের মতো কোম্পানির কাছে এতো "লো হ্যাঙ্গিং ফ্রুট" প্রোডাক্ট রয়েছে সেখানেও সবসময় ওই অ্যাডভান্সড ম্যাথ অথবা অ্যালগরিদম নিয়ে পাগল হচ্ছে না তারা।

বাংলাদেশ বোয়িং কোম্পানি থেকে ড্রিমলাইনারের মতো অ্যাডভান্সড বিমান কিনেছে। এখন বাংলাদেশ যদি সেই 'অ্যাডভান্সড' ড্রিমলাইনার' বিমানটি চালানোর জন্য "বোয়িং কিভাবে বিমানটি তৈরি করেছে" সেটা জানার জন্য দৌড়াদৌড়ি করে, সেটা কি লাভজনক হবে? নাকি সেটার সর্বোত্তমভাবে ব্যবহারের জন্য বিমানটি ঠিকমতো চালানো এবং মেইনটেনেন্স জ্ঞান নিতে পারলেই কাজটা সহজ হবে। এর পাশাপাশি কিভাবে বিমান তৈরি করেছে সেটা জানলে ভালো, তবে সবকিছুর প্রায়োরিটি জানলে কাজের সুবিধা হয়। ছোট্ট জীবন, সবকিছুতে দরকার প্রায়োরিটি। প্রযুক্তির পরের ধাপে যাবেন নাকি একেবারে কেঁচেগণ্ডূষ করে শুরু করবেন? স্ট্যান্ডিং অন দ্যা শোল্ডার্স অফ জায়ান্ট।

কথা হচ্ছে আপনি একটা সমস্যা দিয়ে শুরু করেন। ধরুন এ মুহূর্তে আমার দরকার বাংলায় 'স্পীচ টু টেক্সট' মডেল আমার কাজের জন্য। সেটা করতে গিয়ে কোথায় কোথায় অংক লাগবে শুরুতে সেটা মাথায় আসছে না। বরং এই বাংলার ব্যাপারটা কোথায় অন্য ভাষায় কাজ করছে সেটা দেখছি গত বছর থেকে। গুগল একটা করেছে, তবে আমি চাইবো আমার মোবাইল ফোনে একটা ছোট্ট ইনফারেন্স যা ইন্টারনেট ছাড়াই চলবে। আর দেশি প্রজেক্টে সরকার তো সব ডেটা গুগল সার্ভারে পাঠাতে চাইবেন না প্রসেসিং এর জন্য।

ধরুন, অ্যাডোবি'র ফটোশপের মতো আরো অনেক প্রোডাক্টে ব্যবহার হচ্ছে ডিপ লার্নিং। বিশেষ করে ইমেজ প্রসেসিং এ। এখন আমরা সেই টুলগুলো ঠিকমতো ব্যবহার করে আমাদের দরকারি কমার্শিয়াল প্রোডাক্ট বানাবো নাকি অ্যাডোবি' কিভাবে সেটা ডিপ লার্নিং দিয়ে তৈরি করছে সেটা জানার চেষ্টা করবো? সেই সময় আর প্রায়োরিটি কি আছে আমাদের?

সেভাবে, মেশিন লার্নিংকে রিসার্চ বা কমার্শিয়াল অ্যাপ্লিকেশনে 'কমোডিটি টুল' হিসেবে 'ইমপ্লিমেন্টেশন' অথবা ইন্টিগ্রেট করার কাজটা করতেই কিন্তু এই বই লেখা। সেই জ্ঞান অর্জন করতে আপনাকে 'পিএইচডি' করতে হবে না। পাশাপাশি টুলগুলো ব্যবহারের জন্য গ্রাজুয়েট বা পিএইচডি স্টুডেন্টদের সেই ব্যাকগ্রাউন্ড দরকার নেই। ক্যালকুলাস, লিনিয়ার অ্যালজেব্রা, স্ট্যাটিসটিক্স আর প্রোবাবিলিটি থিওরি লাগলে এই আমিই নিয়ে যাবো অন্য ট্র্যাকে।

তাহলে কি কথা রইলো?

ঠিক ধরেছেন। ডিপ লার্নিংকে ঠিকমতো ব্যবহার করতে শেখা।

প্রচুর পাইথন জুপিটার/গুগল কোলাব নোটবুক থাকবে এই বইয়ে, নিজের প্র্যাকটিসের জন্য। বইয়ের শেষে একটা প্রজেক্ট থাকবে যাতে আমরা বাংলায় সেন্টিমেন্ট অ্যানালাইসিস করতে পারি। আপনারা যাতে বাংলায় ডিপ লার্নিং নিয়ে কাজ শুরু করতে পারেন সেজন্য অনেক কষ্ট করে বইটা লেখা। শুরু করতে তো হবে কোথাও!

প্রায় ২০ বছর আগে শুরু করেছিলাম ব্লগ। লিখতে মন চাইতো। শুরুতে নোটবুক। বলে রাখি আমি অফলাইন ইন্টারনেট যুগের মানুষ। তবে ব্লগিং প্ল্যাটফর্ম শুরু না হলেও এঞ্জেলফায়ার দিয়েই শুরু। ১৯৯৭-৯৮ হবে হয়তোবা। ব্যাপারটা এমন ১ লক্ষ ইচ্ছেমতো শব্দ লিখতে হবে আসল লেখার আগে। তবে, শুরুতে লিখতাম ইংরেজিতে। তবে, আস্তে আস্তে ফিরে এলাম বাংলায়। বুঝলাম, অনেক কাজ আছে আমাদের। বাংলা আমাদের ভাষা হিসেবে সহজ হলেও কম্পিউটেশনের জন্য এর কাজ বাকি আছে এখনো। সেকারণে ডিপ লার্নিং বেছে নেয়া। অসাধারণ ফল পাচ্ছি বটে। এখন দরকার একটা বড় টিম।

এই বইটা এখনো খসড়া পর্যায়ে আছে।