হাতেকলমে পাইথন ডীপ লার্নিং
  • হাতেকলমে পাইথন ডিপ লার্নিং
  • শুরুর ঘটনা
    • শুরুর কথা
    • প্রথম ফ্ল্যাপ
    • এই বইটা থেকে কি আশা করছি?
    • ‘ডিপ লার্নিং’ কি হাইপ? কেন এতো দেরি হলো?
    • কৃতজ্ঞতা
    • কেন শিখবেন মেশিন/ডিপ লার্নিং?
    • বইটা কিভাবে ব্যবহার করবেন?
    • কেন এই বইটা অন্য প্রোগ্রামিং বই থেকে একটু আলাদা?
    • গুগল কোলাব/জুপিটার টেন্সর-ফ্লো ২.x ডকার
    • কিছুই জানিনা, শুরু করবো কোথা থেকে?
    • কেন ডীপ লার্নিং?
      • স্পীচ রিকগনিশন
      • কৃষক আত্মহত্যার যোগসূত্র
      • ডীপফেইক
      • যদি নায়ক না থাকে?
      • 'সেন্টিমেন্ট অ্যানালাইসিস' আর শিক্ষার হারের যোগসূত্র
      • কনটেন্ট মডারেশন - অসুস্থতার যোগসূত্র
      • জাহাজ না আইসবার্গ?
      • গুগল ডুপ্লেক্স
      • টার্গেটের গল্প
    • ঝিঁঝিঁপোকার থার্মোমিটার
    • নিউরাল নেটওয়ার্কে ডাটা কিভাবে থাকে?
    • এক নজরে 'টেন্সর-ফ্লো' ইকো-সিস্টেম
    • ফ্যাশন MNIST ডেটাসেটের ক্লাসিফিকেশন
    • রিগ্রেশন এবং ক্লাসিফিকেশন
    • ডিপ লার্নিং কেন? নন-লিনিয়ার সমস্যা, ফিচার ক্রস
    • ডিপ লার্নিং দিয়ে ডিসিশন বাউন্ডারি, চাঁদ আকারের ডাটাসেট
    • নিউরাল নেটওয়ার্কের কনসেপ্ট এবং রিপ্রেজেন্টেশন লার্নিং
    • নিউরাল নেটওয়ার্কের নিউরাল, ওয়েট, বায়াস, অ্যাক্টিভেশন ফাংশন
    • ডিপ লার্নিং নেটওয়ার্ক: ফরওয়ার্ড এবং নেটওয়ার্ক অপটিমাইজেশনের জন্য ব্যাক প্রোপাগেশন
    • ডিপ নিউরাল নেটওয়ার্কের লেয়ারিং কনসেপ্ট
    • টেন্সর-ফ্লো ডেটাসেট এপিআই দিয়ে কনভল্যুশনাল নিউরাল নেটওয়ার্ক
    • কার্নাল কনভল্যুশন এবং ম্যাক্স পুলিং (সিএনএন)
    • সিএনএন, সিফার ডেটাসেট, টেন্সরবোর্ড/কেরাস কলব্যাক দিয়ে মডেল ট্র্যাকিং
    • কেরাস ‘প্রি-ট্রেইনড’ মডেল এবং তার ব্যবহার
    • ‘কনভলিউশনাল নিউরাল নেটওয়ার্ক’ এবং গ্লোবাল অ্যাভারেজ পুলিং
    • ট্রান্সফার লার্নিং, ‘প্রি-ট্রেইনড’ অক্সফোর্ড ইউনিভার্সিটি ভিজ্যুয়াল জিওমেট্রি গ্রূপের vgg16 ডেটাসেট
    • টেন্সর-ফ্লো মডেল থেকে প্রোডাকশন, টেন্সর-ফ্লো সার্ভিং এবং এপিআই
    • ‘টেন্সর-ফ্লো লাইট’, মোবাইল এবং এমবেডিং ডিভাইসে ডিপ লার্নিং ইনফারেন্স নিয়ে অ্যান্ড্রয়েড অ্যাপ (১)
    • মোবাইল অ্যাপের জন্য সাধারণ "এমনিস্ট" মডেল ট্রেনিং, টেন্সরফ্লো লাইট দিয়ে (২)
    • অ্যান্ড্রয়েড অ্যাপের জন্য "এমনিস্ট" হাতে লেখা ডিজিট চিনতে মডেল ট্রেনিং (৩)
    • অ্যান্ড্রয়েডে ফ্যাশন 'এমনিস্ট' অ্যাপ (৪)
    • বাংলা নাচারাল ল্যাঙ্গুয়েজ প্রসেসিং, টোকেনাইজেশন এবং ভেক্টরাইজেশন
    • এমবেডিং, ওয়ার্ড এমবেডিং, শব্দ এবং সংখ্যার কাছাকাছি এনকোডিং
    • সার্চে এমবেডিং: পরের শব্দটা কি হবে?
    • শব্দের সিমিলারিটি, কাছাকাছি অর্থ, লাইকলিহুড - সঙ্গে 'ফাস্টটেক্সট' এবং 'ওয়ার্ড২ভেক'
    • বাংলায় ছোট্ট সেন্টিমেন্ট অ্যানালাইসিস
    • বাংলায় এন্ড টু এন্ড অ্যাপ্লিকেশন, টেন্সর-ফ্লো হাব
    • একদম স্ক্র্যাচ থেকে টেন্সরফ্লো ২.x মডেল
    • কি করবো সামনে?
    • আরো সাহায্য এবং কৃতজ্ঞতা
Powered by GitBook
On this page

Was this helpful?

  1. শুরুর ঘটনা
  2. কেন ডীপ লার্নিং?

স্পীচ রিকগনিশন

আমি ইদানিং যে বই লিখছি, সেগুলোর জন্য একটা বড় সময় সাহায্য নিচ্ছি গুগলের ভয়েস টু টেক্সট ‘এপিআই’ এর। মানে, আমি মুখে যা বলছি, সেটাই লেখা হচ্ছে আমার গিটহাবে। মোদ্দাকথা, সনাতন কী-বোর্ডের সাহায্য নিতে হচ্ছে না আর। কী-বোর্ডের জায়গা দখল করে নিয়েছে আমার মোবাইল ফোন। সত্যি বলতে, মোবাইল ফোনের কী-বোর্ড এর ইনপুট হিসেবে যাচ্ছে আমার গলা। প্রথম সমস্যা হতে পারে, পুরোপুরি প্রমিত বাংলা লাগছে এখানে। দ্বিতীয় সমস্যা: বাংলায় প্রচলিত ইংরেজি শব্দগুলো থাকছে ‘ইংরেজি’ হয়ে।

এটা ঠিক হয়ে যাবে সামনে। তবে সমস্যা গুলো এই মুহূর্তে মিটিয়ে নিচ্ছি নিজের মতো করে ‘ট্রেইন’ করিয়ে। যেমন, সরাসরি ‘keyboard’ বললে হয়তো সে লিখবে ইংরেজিতে, কিন্তু - আমি যদি একটু ঘুরিয়ে বলি ‘কীবোর্ডে’, তাহলে কিন্তু লিখছে বাংলায়। মানে হচ্ছে, কীবোর্ড ইংরেজিতে লিখলেও ‘কীবোর্ডে’ তো সে লিখতে পারছেনা ইংরেজিতে। আমার ভয়েস স্যাম্পল যখন ফোরিয়ার ট্রান্সফরমেশনে অ্যানালাইসিস হচ্ছে, তখন সে এটাকে ক্লাসিফাই করছে keyboard হিসেবে। ‘কীবোর্ডে’ চলে যাচ্ছে ‘কীবোর্ডে’ অংশে। শব্দটা ইংরেজি হতে পারে তবে ‘কীবোর্ডে’ বললে সেটা কিন্তু বাংলাতেই হওয়া চাই।

ধরুন, আমি শুধু বলেছি “সাধারণ”, তখন সে লিখবে “ণ” দিয়ে তবে - ‘সাধারণভাবে’ বললে সে হয়তোবা ‘ন’ দিয়ে লিখবে। এটা কেন করছে সে? এর অর্থ হচ্ছে আমাদের বাংলার ইন্টারনেট প্রেজেন্সে অনেক ভুল জিনিস প্রচলিত আছে। আর, সে কারণেই ভুল জিনিস বেশি প্রচলিত থাকলে সেটাও সে সঠিকভাবে ধরে নিচ্ছে। আমি যেহেতু ‘স্পীচ টু টেক্সট’ দিয়ে কিছুদিন কাজ করেছি, তখন বুঝলাম এটা আসলে খুব সাধারণ ‘মেশিন লার্নিং’ ধারণা দিয়ে সমাধান করা যাবে না।

এর জন্য প্রয়োজন প্রচুর ব্যবহারকারীর ডাটা, দরকার প্রচুর ভয়েস স্যাম্পল। এক সময়ে আমাদের প্রচুর ভয়েস মেইল স্যাম্পল দিয়েছি ডেভেলপারদের। আসল কথা হচ্ছে, আমরা একই জিনিস উচ্চারণ করি হাজার রকম ভাবে, হাজারো ‘ডায়ালেক্ট’ মিশিয়ে। এর মানে হচ্ছে যে যেভাবেই একটা শব্দ উচ্চারণ করুক না কেন সেটাকে টেক্সট হিসেবে ওইটাই লিখতে হবে। শুদ্ধভাবে। এটা একটা বড় ধরনের ক্লাসিফিকেশন সমস্যা। তবে সেটাকে সে ঠিকমতো করতে পারছে ডীপ লার্নিং দিয়ে। এটাতো গেল শুধু স্পীচ রিকগনিশন-এ।

বর্তমানে ‘মেশিন লার্নিং’এর একটা বড় অংশ চলে এসেছে ‘কম্পিউটার ভিশন’এ। ইংরেজিতে বলছি ‘সিভি’। মানে, কম্পিউটারকে দেখাতে হবে মানুষ আপনি যে ভাবে দেখছেন। ভেতরের কথা বললে কম্পিউটারকে দেখাতে হয় 0 আর 1 এর মধ্য দিয়ে। ওতো বিট ছাড়া চেনে না। আর সে কারণেই ‘মেশিন লার্নিং’এর আরেকটা সাবসেট ‘ডীপ লার্নিং’ চলে আসছে আমাদের সামনে। আপনার হাতের লেখা চেনা থেকে শুরু করে, একটা ছবি থেকে সেই মানুষটিকে ঠিকমতো শনাক্ত করতে পারা, ছবির ভিতরে কি কি জিনিস রয়েছে সেটাকে ঠিকমতো ‘লেবেল’ দেয়া, এই সবকিছুই চলে এসেছে ‘কম্পিউটার ভিশন’এ। সে এক বিস্ময়কর যাত্রা। আছেন তো সাথে?

Previousকেন ডীপ লার্নিং?Nextকৃষক আত্মহত্যার যোগসূত্র

Last updated 5 years ago

Was this helpful?