হাতে কলমে মেশিন লার্নিং
  • হাতেকলমে মেশিন লার্নিং
  • উৎসর্গ
  • প্রথম পাতা
  • মুখবন্ধ
  • কৃতজ্ঞতা
  • কাদের জন্য বইটা?
  • কাদের জন্য নয়
  • কিভাবে পড়বেন বইটা?
  • পর্ব ১: পাল্টে যাবার ঘটনা
    • ১.১. সিডিসি’র ওয়ার্নিং
    • ১.২. ইন্টারকানেকশন কস্ট মডেলিং
    • ১.৩. মানুষের পাশে ডাটা
    • ১.৪. গুগল ফটোজ, টেক্সট টু স্পিচ
    • ১.৫. সরকারি ওপেন ডাটা
    • ১.৬ প্রাইভেট সেক্টর + পাবলিক সেক্টর (ডাটা শেয়ারিং)
    • ১.৭. আর্টিফিসিয়াল ইন্টেলিজেন্স - মেশিন লার্নিংএর প্রসার
    • ১.৮. মেশিন লার্নিং ব্যবহারে এগিয়ে যে ইন্ডাস্ট্রিগুলো
  • পর্ব ২: ডাটা থেকে ভবিষ্যৎ দেখার ধারণা
    • ২.১. মেশিন লার্নিং হ্যাক
    • ২.২. ভবিষ্যৎ দেখার ধারণা + ডাটার গল্প বলার ক্ষমতা
    • ২.৩. মৃত্যু অ্যালগরিদম
    • ২.৪. দেশের নীতিনির্ধারণী ড্যাশবোর্ড
  • পর্ব ৩: মেশিন লার্নিং কি? (৩০ মিনিট)
    • ৩.১. মেশিন লার্নিং জিনিসটা কি?
    • ৩.২. কেন দরকার মেশিন লার্নিং?
    • ৩.৩. মেশিন লার্নিং এর কিছু ভাগ
    • ৩.৪. শুরুর ধারণা - ডাটা নিয়ে
    • ৩.৫. ডাটার তত্ব আর তার প্রসেস
    • ৩.৬. কিভাবে শিখবেন?
  • পর্ব ৪: ক্যাগল প্রতিযোগিতা (৪ সপ্তাহ-৬ সপ্তাহ)
    • ৪.১. ‘ক্যাগল’ কি? আর দরকারই বা কেন?
    • ৪.২. কি করতে হবে ক্যাগলে?
    • ৪.৩. থিওরি বাদ, কেন প্রজেক্ট দিয়ে শুরু?
    • ৪.৪. কেন শুরুতেই ‘আর’ প্রোগ্রামিং এনভায়রনমেন্ট?
    • ৪.৫. মেশিন লার্নিং কমিউনিটি
    • ৪.৬. ক্যাগল কার্নাল এবং অনলাইন হোস্টেড স্ক্রিপ্ট
  • পর্ব ৫: "আর" এনভায়রনমেন্ট
    • ৫.১. "আর" + "আর" ষ্টুডিও
    • ৫.২. "আর" ষ্টুডিওর কিছু খুঁটিনাটি
    • ৫.৩. প্রজেক্ট টাইটানিক + 'আর' ষ্টুডিও
    • ৫.৪. প্রজেক্টের গিটহাব স্ক্রিপ্ট
  • পর্ব ৬: প্রজেক্ট টাইটানিক: বিপর্যয়ে মেশিন লার্নিং
    • ৬.১. টাইটানিকের গল্প
    • ৬.২. কেন প্রজেক্ট" টাইটানিক "? ডাটা কোথায়?
    • ৬.৩. ‘ট্রেনিং’ আর ‘টেস্ট’ ডাটা সেট
    • ৬.৪. ক্যাগলের কোন কোন কার্নাল?
    • ৬.৫. "আর" স্টুডিওতে ডাটা লোড
    • ৬.৬. মেন্যু দিয়ে নাকি স্ক্রিপ্ট ভালো ?
  • পর্ব ৭: প্রেডিকশন
    • ৭.১. প্রথম প্রেডিকশন
    • ৭.২. ডাটা ভিজ্যুয়ালাইজেশন
    • ৭.৩. দ্বিতীয় প্রেডিকশন
    • ৭.৪. তৃতীয় প্রেডিকশন
    • ৭.৫. ডিসিশন ট্রি
    • ৭.৬. চতুর্থ প্রেডিকশন (মেশিন লার্নিং)
    • ৭.৭. পঞ্চম প্রেডিকশন (ফিচার ইঞ্জিনিয়ারিং)
    • ৭.৮. ডাটা প্রি-প্রসেসিং, ডাটা ক্লিনিং এবং ষষ্ঠ প্রেডিকশন
    • ৭.৯. সপ্তম প্রেডিকশন (র‌্যান্ডম ফরেস্ট)
  • পর্ব ৮: কি আছে সামনে?
    • ৮.১. কি শিখলাম আমরা?
    • ৮.২. কোথায় যাচ্ছি এর পর?
    • ৮.৩. সামনের বই
    • ৮.৪. যোগাযোগের মাধ্যম
  • পর্ব ৯: পাইথনে টাইটানিক প্রজেক্ট
    • জুপিটারে প্রজেক্ট টাইটানিক
  • একটা ট্রেনিং প্রোগ্রাম
Powered by GitBook
On this page

Was this helpful?

  1. পর্ব ১: পাল্টে যাবার ঘটনা

১.১. সিডিসি’র ওয়ার্নিং

Previousপর্ব ১: পাল্টে যাবার ঘটনাNext১.২. ইন্টারকানেকশন কস্ট মডেলিং

Last updated 5 years ago

Was this helpful?

Numbers have an important story to tell. They rely on you to give them a voice.

-– Stephen Few

*

সিডিসি’র ওয়ার্নিংটা পেয়ে ঘুরতে থাকলো মাথা। সবসময়ই ঘোরে সেটা, এবার একটু বেশি। ২০০৩ এর শুরুর ঘটনা। ফোর্ট গর্ডনের সিগন্যালস স্কুল পার করে মন দৌড়াচ্ছে দেশে আসার জন্য। ফোর্ট গর্ডন হচ্ছে মার্কিন সেনাবাহিনীর কম্যুনিকেশন স্কুল। তিন মাসের আর্শিয়াকে রেখে আটলান্টিক পাড়ি দেয়া যে কতো কষ্টের সেটা খুলে বলার প্রয়োজন দেখছি না এখানে। এটা ঠিক, হটাত্‍ করেই যাওয়া।

‘এশিয়াতে যাচ্ছ কিন্তু। "সারস" ভাইরাসের জন্য এমুহুর্তে সিঙ্গাপুর বিপদজনক বটে। প্রটেকশন আছে তো ঠিকমতো?’ সিডিসি কর্মকর্তার উদ্বিগ্ন প্রশ্ন।

‘যাই তো আগে।’ বিড়বিড় করলাম।

বলাই হয়নি সিডিসি’র ব্যাপারটা। 'সেন্টার ফর ডিজিস কন্ট্রোল এন্ড প্রিভেনশন' মার্কিনীদের স্বাস্থ্য সম্পর্কিত সব প্রাদুর্ভাব থেকে রক্ষা আর সেটাকে ‘কন্টেইন’ করার সব ব্যবস্থায় সিদ্ধহস্ত তারা। ভার্জিন আটলান্টিকের ফ্লাইটাও ফাঁকা – সারসের ভয়ে। গন্তব্য লন্ডন, তাতে কি? সারসের ভয় দেখাতে চাইলাম না বন্ধুদের। উঠলাম হোটেলে। সারস পাগল করে দিচ্ছিলো পুরো পৃথিবীকে। প্রতিষেধক তৈরী করা যায়নি তখনও। সিঙ্গাপুরে এসে দেখি ভয়াবহ অবস্থা। সবাই হাঁটছে দূরে দূরে। মাস্ক পরে আছে সবাই প্রায়। কোয়ারেন্টাইন করার সব প্রস্তুতি উপস্থিত। পারলে তুলে নিয়ে যায় আমাকে!

ঘড়ির কাটা এগিয়ে নিয়ে এলাম ২০০৯এ। ফ্লু বিপর্যয়ের সাল বললে ভুল হবে কি? প্রথমে বার্ড, এরপর সোয়াইন, সাথে যোগ দিলো হিউমান ফ্লু – কোথা থেকে যেনো উড়ে এলো ইউরেসিয়ান ফ্লু ভাইরাস। সব মিলে তৈরী হলো – দ্যা ডেডলিয়েস্ট ‘এইচ১এন১’ ইনফ্লুয়েন্জা ভাইরাস! এটার অস্তিত্ব সন্মন্ধে জানার আগেই মহামারীর মতো ছড়িয়ে পড়লো 'এইচ১এন১'। সিডিসি’র কাছে তখনো প্রতিষেধক না থাকায় এর ছড়িয়ে পড়ার গতিকে কিভাবে কমিয়ে ‘কন্টেইন’ করা যায় তা নিয়ে বসলো 'রেগুলেটরি বডি'। সব ডাক্তারদের রোগটার গতিবিধি রিপোর্ট করার জন্য অনুরোধ করলো সিডিসি। ছড়িয়ে পড়ার আসল গতি থেকে সিডিসি’র কম্পাইলেশন পিছিয়ে থাকলো প্রায় দু সপ্তাহ।

সাধারণত: মানুষ অসুস্থবোধ মানে কফ কাশি, মাথাব্যথা নিয়ে ডাক্তারের কাছে যায় না সহসাই। তিন চার দিন দেখে, এরপর অবস্থার অবনতি হলেই যায় ডাক্তারের কাছে। সব রোগীদের চরিত্র একই। বাঙালি আর মার্কিনী বলে ফারাক নেই। ডাক্তারকে দেখানোর পর সন্দেহজনক হলে রিপোর্ট করেন সিডিসিকে। সব জায়গার ইনপুট নিতে লাগে আরো দিন চারেক। সেটাকে ট্যাবুলেশন করে রিপোর্ট আকারে পাবলিশ করতে গিয়ে আসল ঘটনার উত্পত্তিস্থল থেকে টাইমল্যাগ হয় দুই সপ্তাহ। মহামারীর সময় দু সপ্তাহ ‘ল্যাগ’ মানে সাফ হয়ে যেতে পারে একেকটা অঙ্গরাজ্য। আর এই দুই সপ্তাহে ভাইরাস ঘুরে আসতে পারবে মঙ্গল থেকে। সরকারের চোখে ঠুলি পরে থাকা ছাড়া উপায় থাকলো না আর – এরকম সংকটময় সময়ে।

কল মি ক্রেইজি, অসুস্থবোধ করলেই তার সিম্পটম ধরে করি গুগল। চোখের এনজিওগ্রাম করলাম সেদিন। রিপোর্ট নিয়ে যেতে বলেছে ডাক্তার পাঁচদিন পর। পাঁচদিন ধরে রিপোর্ট নিয়ে বসে থাকার লোক নই আমি। রিপোর্টের কিওয়ার্ড নিয়ে করলাম গুগল ইমেজ সার্চ। আমার এনজিওগ্রামের ছবির সাথে মেলালাম তাবৎ পৃথিবীর বয়স্কদের কেসস্টাডি। মন খারাপ হয়ে গেলো। পাঁচদিন পর একই গল্পের ভাঙ্গা রেকর্ডিং শুনলাম ডাক্তারের কাছ থেকে। বরং তিনি সময় দিয়েছিলেন মিনিট চারেক। আর ইউটিউবে আধাঘন্টা। তারমানে এই নয় যে আপনি যাবেন না ডাক্তারের কাছে। ডাক্তার প্রথম। ভেতরের খবর জানতে হলে করবেন গুগল। আমার ধারণা, যা একান্তই ব্যক্তিগত – মানুষ তার একান্ত সমস্যা বৌকে বলার আগে বলে গুগলকে। গুগলতো আর মানুষ নয়, তাহলে আর লজ্জা কিসের। ওতো একটা প্রোগ্রাম। আরো একান্ত হলে ব্রাউজার নিজেই দিচ্ছে ইন্কগনিটোর মতো মোড। রোগের সিম্পটম থেকে শুরু করে ‘বস ঝাড়ল কেন আজ অফিসে’ সব উত্তর আছে গুগলে।

গুগলের এজেন্ট নাকি আপনি?

নাহ, বরং ওর মডেলিং শিখে বাংলাদেশে কিভাবে লাগানো যায় তাই দেখছি চেখে।

ফিরে আসি গল্পে। পৃথিবীর মানুষ 'এইচ১এন১' ভাইরাস সম্মন্ধে জানার কয়েক সপ্তাহ আগেই অসাধারণ একটা পেপার ছাপা হয় সাইন্টিফিক জার্নাল ‘নেচারে’| গুগলের কয়েকজন কম্পিউটার ইঞ্জিনিয়ার মিলে লিখেছেন পেপারটা। মার্কিন হেলথকেয়ার ইন্ডাস্ট্রি আর সিডিসি’র চোখ কপালে। বলে কি গুগল? ফ্লুর বিস্তৃতির ব্যাপ্তি নাকি দেখতে পায় সে রিয়েলটাইম! কাহিনীর শুরুটা সোজা। মানুষ সর্দি কাশি বা অন্যান্য সিম্পটম সন্মন্ধে জানতে আর তার জন্য কি ঔষধ হতে পারে তা নিয়ে গুগল করে প্রথমেই। প্রতিদিনের চারশো কোটি সার্চ কোয়েরি থেকে 'এইচ১এন১' ফ্লুর জন্য প্রযোজ্য পাঁচ কোটি সচরাচর সার্চ টার্ম থেকে প্রাথমিক একটা মডেল দাড় করায় গুগল। তারপর সেটাকে মেলায় ২০০৩ থেকে ২০০৮ সালের সিডিসি’র ফ্লুর ডাটা থেকে। আগের পাঁচ বছরের ডাটা আর বর্তমান ডাটার পয়তাল্লিশ কোটি ম্যাথমেটিকাল মডেল প্রসেস করতে গিয়ে ফ্লু’র সাথে কো-রিলেটেড পয়তাল্লিশটা ইউনিক সার্চ টার্ম কাজটাকে সহজ করে নিয়ে আসলো আরো। এরপর ফ্লু’র সম্পর্কিত সার্চ কোয়েরিগুলো কোথা থেকে আসছে তা বের করা সেকেন্ডের ব্যাপার। ফলে, সিডিসি থেকে আরো নির্ভুল আর রিয়েলটাইম পরিসংখান পাবলিশ করলো গুগল। এই প্রজ্ঞা নিয়ে সরকারী কর্মকর্তারা তৈরী হয়ে গেলো ‘এইচ১এন১ ফ্লু’ মহামারী আকার ধারণ করার সপ্তাহ দুই আগে। ভালয় ভালয় পার হয়ে গেলো ২০০৯, এই জ্ঞান তাদের ভবিষ্যত যেকোনো মহামারী ঠেকানোর জন্য হয়ে রইলো একটা সোনার খনি! সত্যি!

বাংলাদেশের রয়েছে হাজারো সমস্যা। আবার সরকারীভাবে আমাদের কাছে রয়েছেও হাজারো তথ্য। তবে সেগুলো আছে একেক সাইলোতে। যোগসূত্র না থাকার ফলে ‘প্রজ্ঞা’ আসছে না জনকল্যানে। জর্জ ওরঅয়েলকে সন্দেহ করে লাভ নেই কোনো। দেশের সমস্যা চিন্হিত করাটাই আমাদের জন্য 'হাফ দ্য ব্যাটেল'। গার্টনার, কেপিএমজি, 'প্রাইস-ওয়াটারহাউস-কুপার্স' এর বাংলাদেশ সম্পর্কিত গালভরা রিপোর্ট দেখে উদ্বেলিত হলেও বাইরের কোম্পানিগুলো বাংলাদেশের খবর জানে আমাদের থেকে বেশি। দক্ষতা, জ্ঞান আর প্রজ্ঞা অর্জন করতে হবে আমাদেরকেই – নিজেদেরকে জানার জন্য। দেশকে এগিয়ে নিয়ে যেতে হবে সেই তিন অর্জন থেকে। এগিয়ে যাবার জন্য প্রযোজ্য জ্ঞান তো আর শিখিয়ে যাবে না অন্য কেউ। সেজন্য রয়েছে বিগ ডাটা আর অর্জন করতে হবে তাকে ট্রান্সলেট করার সক্ষমতা। বইয়ের পাশাপাশি এক্সেলশিট পড়তে যে মজা পাবো সেটা বুঝিনি আগে। ভবিষ্যত দেখতে চাইলে এর ভালো বিকল্প পাইনি এখনো। সাধারণ কোম্পানির সিইওর জন্য ড্যাশবোর্ড তৈরী করা হলে দেশ চালানোর ক্ষেত্রে নীতিনির্ধারণীতে থাকা মানুষগুলোর জন্য একই জিনিস থাকা উচিত নয় কি? বলুন আমাকে, বানিয়ে দেবো দেশের জন্য!

টাইম টু গিভ ব্যাক! কম দেয়নি তো দেশ আমাকে আপনাকে।

[নেচারের পেপারটা চেয়েছেন কয়েকজন। আপনার ইউনিভার্সিটি সেটা সাবস্ক্রাইব করলে পেয়ে যাবেন সেখানে। তবে সাপ্লিমেন্টারি ডকুমেন্ট হিসেবে সেই বিখ্যাত এক্সেল শিট + কোয়েরির সার্চ টার্মগুলো পাবেন এই লিঙ্কে। বিনামূল্যে। এক্সেল ভক্ত বলে আপনারও যে সেটা ভালো লাগবে সেটা বলছি না আমি। তবে ধারণা নিতে বাধা নেই কারো। ধন্যবাদ গুগলকে। তথ্য সবার মধ্যে ছড়িয়ে দেবার ধারণাটাই বড় করেছে কোম্পানিটাকে। ছড়িয়ে দিন জ্ঞান সবার মধ্যে, প্রজ্ঞা বের করে নেবার দায়িত্ব নীতিনির্ধারণীদের।]

http://www.nature.com/nature/journal/v457/n7232/suppinfo/nature07634.html