হাতে কলমে মেশিন লার্নিং
  • হাতেকলমে মেশিন লার্নিং
  • উৎসর্গ
  • প্রথম পাতা
  • মুখবন্ধ
  • কৃতজ্ঞতা
  • কাদের জন্য বইটা?
  • কাদের জন্য নয়
  • কিভাবে পড়বেন বইটা?
  • পর্ব ১: পাল্টে যাবার ঘটনা
    • ১.১. সিডিসি’র ওয়ার্নিং
    • ১.২. ইন্টারকানেকশন কস্ট মডেলিং
    • ১.৩. মানুষের পাশে ডাটা
    • ১.৪. গুগল ফটোজ, টেক্সট টু স্পিচ
    • ১.৫. সরকারি ওপেন ডাটা
    • ১.৬ প্রাইভেট সেক্টর + পাবলিক সেক্টর (ডাটা শেয়ারিং)
    • ১.৭. আর্টিফিসিয়াল ইন্টেলিজেন্স - মেশিন লার্নিংএর প্রসার
    • ১.৮. মেশিন লার্নিং ব্যবহারে এগিয়ে যে ইন্ডাস্ট্রিগুলো
  • পর্ব ২: ডাটা থেকে ভবিষ্যৎ দেখার ধারণা
    • ২.১. মেশিন লার্নিং হ্যাক
    • ২.২. ভবিষ্যৎ দেখার ধারণা + ডাটার গল্প বলার ক্ষমতা
    • ২.৩. মৃত্যু অ্যালগরিদম
    • ২.৪. দেশের নীতিনির্ধারণী ড্যাশবোর্ড
  • পর্ব ৩: মেশিন লার্নিং কি? (৩০ মিনিট)
    • ৩.১. মেশিন লার্নিং জিনিসটা কি?
    • ৩.২. কেন দরকার মেশিন লার্নিং?
    • ৩.৩. মেশিন লার্নিং এর কিছু ভাগ
    • ৩.৪. শুরুর ধারণা - ডাটা নিয়ে
    • ৩.৫. ডাটার তত্ব আর তার প্রসেস
    • ৩.৬. কিভাবে শিখবেন?
  • পর্ব ৪: ক্যাগল প্রতিযোগিতা (৪ সপ্তাহ-৬ সপ্তাহ)
    • ৪.১. ‘ক্যাগল’ কি? আর দরকারই বা কেন?
    • ৪.২. কি করতে হবে ক্যাগলে?
    • ৪.৩. থিওরি বাদ, কেন প্রজেক্ট দিয়ে শুরু?
    • ৪.৪. কেন শুরুতেই ‘আর’ প্রোগ্রামিং এনভায়রনমেন্ট?
    • ৪.৫. মেশিন লার্নিং কমিউনিটি
    • ৪.৬. ক্যাগল কার্নাল এবং অনলাইন হোস্টেড স্ক্রিপ্ট
  • পর্ব ৫: "আর" এনভায়রনমেন্ট
    • ৫.১. "আর" + "আর" ষ্টুডিও
    • ৫.২. "আর" ষ্টুডিওর কিছু খুঁটিনাটি
    • ৫.৩. প্রজেক্ট টাইটানিক + 'আর' ষ্টুডিও
    • ৫.৪. প্রজেক্টের গিটহাব স্ক্রিপ্ট
  • পর্ব ৬: প্রজেক্ট টাইটানিক: বিপর্যয়ে মেশিন লার্নিং
    • ৬.১. টাইটানিকের গল্প
    • ৬.২. কেন প্রজেক্ট" টাইটানিক "? ডাটা কোথায়?
    • ৬.৩. ‘ট্রেনিং’ আর ‘টেস্ট’ ডাটা সেট
    • ৬.৪. ক্যাগলের কোন কোন কার্নাল?
    • ৬.৫. "আর" স্টুডিওতে ডাটা লোড
    • ৬.৬. মেন্যু দিয়ে নাকি স্ক্রিপ্ট ভালো ?
  • পর্ব ৭: প্রেডিকশন
    • ৭.১. প্রথম প্রেডিকশন
    • ৭.২. ডাটা ভিজ্যুয়ালাইজেশন
    • ৭.৩. দ্বিতীয় প্রেডিকশন
    • ৭.৪. তৃতীয় প্রেডিকশন
    • ৭.৫. ডিসিশন ট্রি
    • ৭.৬. চতুর্থ প্রেডিকশন (মেশিন লার্নিং)
    • ৭.৭. পঞ্চম প্রেডিকশন (ফিচার ইঞ্জিনিয়ারিং)
    • ৭.৮. ডাটা প্রি-প্রসেসিং, ডাটা ক্লিনিং এবং ষষ্ঠ প্রেডিকশন
    • ৭.৯. সপ্তম প্রেডিকশন (র‌্যান্ডম ফরেস্ট)
  • পর্ব ৮: কি আছে সামনে?
    • ৮.১. কি শিখলাম আমরা?
    • ৮.২. কোথায় যাচ্ছি এর পর?
    • ৮.৩. সামনের বই
    • ৮.৪. যোগাযোগের মাধ্যম
  • পর্ব ৯: পাইথনে টাইটানিক প্রজেক্ট
    • জুপিটারে প্রজেক্ট টাইটানিক
  • একটা ট্রেনিং প্রোগ্রাম
Powered by GitBook
On this page

Was this helpful?

  1. পর্ব ৬: প্রজেক্ট টাইটানিক: বিপর্যয়ে মেশিন লার্নিং

৬.১. টাইটানিকের গল্প

Previousপর্ব ৬: প্রজেক্ট টাইটানিক: বিপর্যয়ে মেশিন লার্নিংNext৬.২. কেন প্রজেক্ট" টাইটানিক "? ডাটা কোথায়?

Last updated 5 years ago

Was this helpful?

I figure life's a gift and I don't intend on wasting it.

-- Jack; Titanic Movie

কাহিনীর সাল ১৯১২। সত্যি ঘটনা। ধন্যবাদ দিতে হয় জেমস ক্যামেরনকে। উনি আমাকে বাঁচিয়েছেন নতুন করে গল্পটা ফাঁদতে। এই ‘আন-সিঙ্কেবল’ মানে ‘ডুববার নয়’ আরএমএস টাইটানিক’ ডুবে যায় আটলান্টিক পাড়ি দেবার সময়। একদম প্রথম যাত্রায়। আইসবার্গে ধাক্কা লেগে। তখন রাত ১১:৪০। ধারণা করতে পারি - ২২২৪ জন যাত্রী আর ক্রু’র মধ্যে প্রায় সবাই ঘুমাতে গিয়েছিলেন নিজ নিজ কেবিন অথবা বাঙ্কারে। পরের ঘটনা সবার জানা।

১৫০২ জন মারা যান পর্যাপ্ত পরিমান লাইফবোট না থাকাতে। টাইটানিকের ডিজাইন ক্যাপাসিটিতে নেবার কথা ছিলো ৩২টা লাইফবোট। সেখানে ‘ডুববার নয়' ধারনাটা প্রভাবিত করেছিলো পুরো লাইফবোট সেট না নেবার ব্যাপারে। এখানে একটা বড় ভুল হয়েছিলো। জাহাজ ডুববে কি ডুববে না সেটার ওপরে নির্ভর করে জাহাজের সেফটি মেকানিজমে ছাড় দেবার কোন সুযোগ ছিলো না। কম লাইফবোট নিলে সান ডেকে জায়গা কিছুটা বাঁচে বলে এই সুযোগটা নিয়েছিলো ম্যানেজমেন্ট। শেষমেষ - তারা নিয়েছিলো ২০টা বোট যা আসলে বাঁচাতে পারতো ১১৮০ জন মানুষ মাত্র। তবে - এ ধরনের বিপর্যয়ে কে বাঁচবেন আর মারা যাবেন সেটা কিছুটা ভাগ্য নিয়ন্ত্রিত হলেও পারিপার্শ্বিক অবস্থার প্রভাব ফেলে দেয়া যায় না একেবারে। টাইটানিক জাহাজটার একটা ক্রস-সেকশন ড্রয়িং দেখানো হলো আপনাদের বোঝার সুবিধার জন্য।

ছবি: টাইটানিকের ক্রস সেক্শনের ভেতরের অংশ

অনেকে বলবেন "ক্রস সেকশন" কেন? আসলে আমাদের দেখতে হবে বেশ কয়েকটা জিনিস। তার শুরুটা হতে পারে জাহাজের ডিজাইন অংশ দিয়ে। একজন মানুষ জাহাজ ডুববার কালে সবচেয়ে কম সময়ে কিভাবে একটা লাইফবোটে এক্সেস পাবেন? জাহাজের পাটাতনে কিন্তু সব লাইফবোট। ডেক থেকে সবচেয়ে কাছের কেবিনগুলো হচ্ছে A, B, C ... থেকে শুরু করে সবশেষে F আর G কেবিন। মনে আছে আমাদের টিকেটের কথা? প্রতিটা টিকেটের নম্বর শুরু হয়েছে এই কেবিন সংখ্যা দিয়ে। সবচেয়ে ওপরে আছে S সানডেক। G হচ্ছে সবচেয়ে লোয়ার ডেক। এরকম অনেক জিনিসকে মাথায় নিতে হবে আমাদের।

আমাদের টাইটানিক জাহাজের যাত্রীদের বাঁচা মরার ওপর একটা 'হাইপোথিসিস' তৈরি করা যাক। দুটো ধারণা তৈরি করা যায় এ ব্যাপারে। আমি যাত্রীদের 'পার্সপেক্টিভ' থেকে বলছি।

১. টাইটানিক যে ডুবতে পারে সেটাকে মানসিকভাবে স্বীকার করে নিতে পারা, এই বাস্তবতাকে স্বীকার করে নেওয়াটাই অনেক বড় ব্যাপার ওই সময়ে

২. ডোবার সময়ে সেই অল্প সংখ্যক লাইফ বোটে সুযোগমতো জায়গা পাওয়া

সমস্যার ভেতরে ঢোকার ক্ষমতা আর ‘কমন সেন্সে’র ওপর ভর করে আমাদের কাজ এগুবে সামনে। আমাদের চেষ্টা হবে - নির্দিস্ট করে কারা বেঁচে আর কারা মারা গিয়েছিলেন সেটা ঠিকমতো ‘প্রেডিক্ট’ করতে পারা। সেখানেই আসবে আমাদের মডেলের মুন্সিয়ানা। ভুল হবে অনেক। ভুল বললাম, ভুল করতে হবে অনেক। ওই ভুল থেকেই বের হবে সেরা মডেল। বাস্তবতার নিরিখে মডেল। যারা ভুল করতে চান না তাদেরকে ভুল করাবো ইচ্ছে করে। ওই ভুলটাই শেখাবে বড় কিছু!

মডেলের জন্য ডাটা পাব ক্যাগল.কম থেকে। ক্যাগল শুরু ‘কে’ দিয়ে। "।অনেকেই বলবেন - ডাটা সায়েন্টিস্টদের জন্য এক নম্বর সাইট। আমরা এখানে শিখবো হাতে কলমে করে। মেশিন লার্নিং নিয়ে পৃথিবীর হাজারো সরকারী বেসরকারী ডাটা হোস্ট করছে সমস্যার সমাধানে। ৭ হাজারের মতো টিম ‘কমপিট’ করছে হাজারো সমস্যা নিয়ে। রিয়েল ওয়ার্ল্ড সমস্যা দেয়া আছে ওখানে। এ মুহুর্তে দেখছি একটা ‘ক্যান্সার’ রিলেটেড সমস্যা চলছে এক নম্বরে। দিয়েছে ইন্টেল। পুরস্কার এক লাখ ডলার। হোমল্যান্ড সিকিউরিটির একটা সমস্যা। দেড় লাখ ডলার। আরো অনেক অনেক সমস্যা চলছে একসাথে।

আমাদের টাইটানিক চ্যালেঞ্জের ডাটা পাব লিংক থেকে। ডাটা ডাউনলোড করার আগে দেখে নিন মূল পাতাটা। পড়লে ভালো। আমি হাতে পেলে বাদামের ঠোঙ্গাও পড়ি। বাড়ে পারসেপশন। সাইটের ‘কপিরাইট ইনফরমেশন’ ছাড়া সবই দরকারী। না পড়লেও অসুবিধা হবে না আপনাদের। কারণ, আমি হাজারো ‘হিন্টস’ দিতে থাকবো পুরো কোর্স ধরে।

ধারণা করছি, ‘ক্যাগল’ সাইটে ঢু মেরেছেন কিছুটা। না গেলেও অসুবিধা নেই। এখন গেলেও হবে। মিনিট দশেকের জন্য। পরিচিতি হতে আরকি। ব্যাপারটা কিছুটা এমন, সমস্যাকে কাছে থেকে দেখা। সমাধানের গল্প পরে। লিংক হচ্ছে, বের করতে হবে - ডুবন্ত টাইটানিক থেকে বাঁচবেন কে কে? নাম ধরে ধরে। জ্যাক আর রোজ, দিয়ে শুরু করবো’খন।

www.kaggle.com"
https://www.kaggle.com/c/titanic/data
https://www.kaggle.com/c/titanic