৩.২. কেন দরকার মেশিন লার্নিং?

If you run into a wall, don’t turn around and give up. Figure out how to climb it, go through it, or work around it.

-— Michael Jordan, Basketball Player and Entrepreneur

মেশিন লার্নিং নিয়ে কিছু গল্প আছে আমার। নিজের ধারণা থেকে। শুরুতেই প্রশ্ন। আচ্ছা, কিভাবে প্রেডিক্ট করবেন এই অস্থির পৃথিবীকে? যেখানে সবকিছুই এতো অনিশ্চিত। আসলেই তাই। আসলে কি তাই? আমরা যারা ডাটা নিয়ে কাজ করি তারা একটা বিষয় জানি। অনেক সময়, অল্প ডাটা দেয় না কিছুই - যদি না সেটাকে দেখা যায় আরো বড় স্কেলে। বড় ডাটাফ্রেমে।

ধরুন, একজনকে ফলো করছেন অনেকদিন ধরে। অফিসের কাজেই। কমপ্লায়েন্সের নিয়ম ধরে। ধারণা করছেন - উনি একটা কাজ করেছেন, তবে প্রমান করতে পারছেন না। বসে আছেন - উনি কবে ওই কাজটা করবেন আবার। অনেক সময় অল্প সময়ের ব্যবধানে ব্যাপারটা না ধরা গেলেও - জিনিসটা 'স্কেল-আপ' করলে ঠিক ঠিক পাওয়া যাবে আরো কিছু প্যাটার্ন। আসল কথা হচ্ছে, আমরা হয়তোবা জানি না তার রিদমটা কোথায়। মনে পড়ছে নাকি ডেক্সটারের কথা?

পৃথিবীর প্রতিটা জিনিসের একটা প্যাটার্ন আছে। হয়তোবা কোন কোনটা চোখে পড়ে আমাদের জীবদ্দশায়। আবার, অনেকগুলোর লাগে অনেক অনেক সময়। কয়েক হাজার বছর। তবে, বিশ্বাস করতে হবে - প্রতিটা জিনিসের আছে প্যাটার্ন। থাকতে হবে। দেখুন আমাদের গ্যালাক্সিকে। প্রতিটা গ্রহ, উপগ্রহ ছুটছে তাদের নিজ গতিতে। জোয়ার ভাঁটা। আমাদের শরীরের অথবা এই পৃথিবীর প্রতিটা অনু পরমাণুর ইলেক্ট্রন চলছে নিজের গতিতে। তাদের প্যাটার্নে। একটা হিসেবের মধ্যে।

অনেক ইন্স্যুরেন্স কোম্পানি প্রেডিক্ট করেন তাদের বীমা গ্রহণকারীদের। করতে হয় ব্যবসার খাতিরে। কারণ, আমরা সবাই কারো না কারো প্রোডাক্ট। তারা প্রেডিক্ট করতে চান মানুষটা প্রিমিয়াম দিতে পারবেন কতোদিন। নিরীহ একটা প্রেডিকশন। ট্র্যাক করেন তার প্রতিটা অসুখের খবর, সেটার ট্রিটমেন্ট প্রসিডিউর। কি ঔষুধ নিয়েছেন। কি করেন - চাকরি না অবসর। দেয়া হয় প্রতিটা জিনিসের একটা ওয়েটেজ। বুঝতে পারছেন কি বলতে চাইছি আমি। একটা মানুষের স্বাভাবিক মৃত্যুর হিসেব করতেই পারে তারা। কারণ, তার অসুখ বিসুখের খরচ যোগান তারাই।

ব্যাপারটা মাথায় ঢোকে ক্যাগলের একটা কম্পিটিশন করতে গিয়ে। সত্যিকারের একটা ঘটনা নিয়ে এই প্রেডিকশন। টাইটানিক জাহাজডুবির ঘটনায় কে মারা গিয়েছিলেন আর কে বেঁচে এসেছিলেন সেটার প্রেডিকশন করছিলাম এই কম্পিটিশনে। এক এক জন ধরে ধরে। যেমন, জ্যাক আর রোজের ব্যাপারটা জানি আমরা। এই "অস্বাভাবিক" মৃত্যুর হিসেব করতে গিয়ে জানতে হলো মনোবিজ্ঞান। মানুষের পরিবারের কাঠামোর ভেতরের গল্প। মানুষের নামে কি আসে যায় কিছু? মানে, ঢুকে পড়লাম নতুন কয়েকটা ডোমেইনের জ্ঞান ভান্ডারে। কোডিং এখানে গৌণ।

মেশিন লার্নিং মূলত স্ট্যাটিসটিক্স আর কম্পিউটার সাইন্সের ছোট্ট একটা অংশ হলেও, তবে এটা শুধুমাত্র কম্পিউটার বিজ্ঞানীদের নয়। বরং, আমি দেখি মেশিন লার্নিং নিয়ে কাজ করছে বাইরের সব মানুষ। নিজ নিজ ডোমেইনে। আমি টেলিযোগাযোগের মানুষ। একটা নেটওয়ার্ক কতো লোড নিতে পারবে সেটার ডিজাইন ক্যাপাসিটি করতে পারতে হবে রোল-আউটের বহু আগে। ডাটাসেন্টারের হার্ডডিস্ক কবে 'ফেল' করবে সেটা না জানলে হবে কিভাবে?

মেশিন লার্নিং নিয়ে বেশি কাজ করছে 'লিগ্যাল প্র্যাকটিশনার' আর হেলথকেয়ার ইন্ডাস্ট্রি। বিলিয়ন ডলারের ইনভেস্টমেন্ট চলে গেছে 'অটোনোমাস' কার ইন্ডাস্ট্রিতে। আন্ত:বিভাগ লরিগুলো চালাবে কে? অনেক শহর জুড়ে চলছে পাবলিক ট্রানজিট সিস্টেম। স্বয়ংক্রিয়ভাবে। আকাশের প্লেন চালায় কে প্রথম আর শেষ তিন চার মিনিট ছাড়া? ফেসবুকে আপনার ত্রিশ বছরের পুরানো বন্ধুকে চেনায় কে?

শেখাচ্ছে কে?

মেশিন লার্নিং। আর সেটা শিখতে এসেছেন জায়গা মতো। একদম। চুক্তি - এক বছর। না শিখে যাবেন কোথায়?

একটা অ্যাড বানিয়েছিল আইবিএম। বছর তিনেক আগে। এই ‘মেশিন লার্নিং’ নিয়ে। প্রথম যখন দেখি তখন মনে হয়েছিলো কিছুটা বানানো গল্প, আজ সেটা নয়। বরং, পুরো জিনিসটাই করে দেখাতে পারবে মেশিন লার্নিং। আমার সাথে যখন নামবেন শিখতে – তখন বুঝবেন মিথ্যা বলছি কি না। যাদের নেট কচ্ছপের মতো – তাদের জন্য বলি গল্পটা।

‘ক’ দেশের পুলিশ ডিপার্টমেন্টের কাজই পাল্টে গেলো মেশিন লার্নিংয়ের কল্যানে। হিস্ট্রিক্যাল ক্রাইম ডাটা অ্যানালাইজ করে ক্রিমিনালদের প্যাটার্ন বুঝে যেতো ওই দেশের আইন প্রয়োগকারী সংস্থা। সেটা জেনে ওই ‘মাইনোরিটি রিপোর্ট’ মুভির মতো আগে থেকেই ক্রাইম সিনে হাজির হয়ে যেতো পুলিশ।

অ্যাডে দেখা যাচ্ছে, দোকান ডাকাতি করতে গাড়ি থেকে নেমেছে এক মানুষ। দোকানের সামনে গিয়েই দেখা পুলিশের সাথে। দূর থেকেই চোখাচোখি হলো তাদের। পুলিশ একটা ‘ফ্রেন্ডলি জেসচার’ দিলো তার কফির কাপ তুলে। লোকটা ফিরে গেলো নিজের ডেরায় – ডাকাতি ফেলে। মানে, ঘটনাটা না ঘটতে দিয়েই সাহায্য করছে পুলিশ। এখনকার জঙ্গিবাদের উত্পত্তি খুঁজতেও মেশিন লার্নিংকে কাজে লাগাচ্ছে উন্নত দেশগুলো।

ডাটা নিয়ে কাজ করি বলে পরিচয় আছে অনেক ‘ডাটা সায়েন্টিস্ট’দের সাথে। মজার কথা, মেশিন লার্নিং লাগছে সব ফিল্ডে। ডাক্তার, ইঞ্জিনিয়ার, আবহাওয়াবিদ, অ্যাস্ট্রফিজিসিস্ট, নগরবিদ, কে নেই এখানে? রাজনীতিবিদদের লাগছে ভোটের ধারণা পেতে। আগে ভাগে। কাকে পাওয়া যাবে তার দলে? কে হবেন 'প্রভাবিত'?

আমলাদের লাগছে ঠিক সিদ্ধান্ত নিতে। হাওরের পানি উপচে পড়বে কি না সেটাও জানতে লাগবে এই জিনিস। গরীব দেশের ভুল সিদ্ধান্তের ফলাফল ভয়াবহ। টাকা + সময় নষ্ট হয় দুটোই। প্রাকৃতিক বিপর্যয়ে জানমালের ক্ষতি হয় অনেক। ওই বিপর্যয়/দুর্ঘটনা আগে থেকে 'দেখার' জ্ঞান দিয়েছেন সৃষ্টিকর্তা। রোগ হিসেবে ক্যান্সারটা খারাপ না ভালো, সেটা বুঝতে লাগছে ডাক্তারদের। ঔষুধ কোম্পানিগুলোর।

আমার ধারণা, পুরনো ডাটা থেকে ভবিষ্যত দেখতে চায় সবাই। আর তাই, সামনের পাঁচ বছরে এটা লাগবে সবারই। মুদি দোকানদার সহ। কোন মাল বেশি উঠবে সামনের মাসে, সেটার ‘ফোরকাস্ট’ করবে কে?

মেশিন লার্নিং।

তবে, আমরা জীবনে অনেক প্রজেক্ট তৈরী করি ‘রিয়েল ওয়ার্ল্ড’ এপ্লিকেশন না জেনে। আর তাই শিখি না অনেক কিছুই। শেখার দরকার যা জিনিস, সেগুলো শিখছিনা। আর শিখছি অনেক কিছু - যার কোন দাম নেই সময়ের সাথে। ইন্ডাস্ট্রিতে আমার ‘মেন্টর’ আছেন বেশ কয়েকজন। একজন বলেছিলেন একটা কথা, প্রায় বিশ বছর আগে। ‘যাই শিখবেন – সেটার ‘রেভিনিউ ম্যাপিং’ করে নেবেন আগে। অতটুকুই শিখবেন যা বিক্রি করতে পারবেন মার্কেটপ্লেসে। পয়সাই অনুপ্রেরণা দেবে আরো কিছু শিখতে। বাড়তি সবকিছু নয়েজ।’