অ্যান্ড্রয়েড অ্যাপের জন্য "এমনিস্ট" হাতে লেখা ডিজিট চিনতে মডেল ট্রেনিং (৩)
Last updated
Last updated
যেহেতু আমাদের বইয়ের ফোকাস হচ্ছে ডিপ লার্নিং, সেকারণে অ্যান্ড্রয়েড অ্যাপ ডেভেলপমেন্ট নিয়ে মাথা ঘামাবো না বেশি। আর তাই একটা স্কেলিটন সোর্স কোডকে আমাদের মতো করে তৈরি করে নেব বোঝানোর জন্য - কোথায় ডিপ লার্নিং মডেল ব্যবহার করা হয় একটা অ্যাপে।
১. অ্যান্ড্রয়েড অ্যাপের একটা স্কেলিটন সোর্সকোড ডাউনলোড
শুরুতে আমরা একটা অ্যান্ড্রয়েড স্কেলিটন অ্যাপ এর সোর্স কোড ডাউনলোড করে নেই টেন্সরফ্লো এর গিটহাব এর উদাহরণ পেজ থেকে। লিংক: https://github.com/tensorflow/examples/archive/master.zip। সেটাকে আনজিপ করে এক্সট্র্যাক্ট করে নেই একটা ফোল্ডারে।
২. অ্যাপের সোর্সকোড ইমপোর্ট করে নিয়ে আসি অ্যান্ড্রয়েড ষ্টুডিওতে
চালু করি অ্যান্ড্রয়েড ষ্টুডিও।
ক্লিক করি "ইমপোর্ট প্রজেক্ট", মানে Import project (Gradle, Eclipse ADT, etc.)।
একটা ফোল্ডারকে দেখিয়ে দেই যেটা আমরা এক্সট্র্যাক্ট করেছিলাম। ফোল্ডারের নাম হচ্ছে lite/codelabs/digit_classifier/android/start/
ইমপোর্ট প্রসেসটাকে শেষ পর্যন্ত চলতে দিতে হবে।
৩. আগে ডাউনলোড করা টেন্সরফ্লো লাইট মডেল রাখতে হবে অ্যাসেট ফোল্ডারে
মনে আছে এমনিস্ট টেন্সরফ্লো লাইট মডেলের ফাইলটার কথা? সেটাকে mnist.tflite কপি করে রেখে দেই আপনার নিজস্ব এক্সট্র্যাক্ট করা lite/codelabs/digit_classifier/android/start/app/src/main/assets/ ফোল্ডারে। আমারটা ছবিতে দেখুন। ফোল্ডার ব্যাপারটা ইম্পরট্যান্ট, শুরুতে আমার সাথে থাকুন।
৪. সোর্সে দেয়া build.gradle ফাইল দরকার মতো আপডেট করি
অ্যাপ মডিউলের build.gradle অংশে নিচের ব্লক খুঁজে বের করি।
২. আমাদের জাভা ক্লাসিফায়ার mnist.tflite ফাইলটাকে অ্যাসেট ফোল্ডার থেকে পড়ে সেটাকে লোড করে ইন্টারপ্রেটারে তার দরকারি ইনফারেন্সের জন্য। এই ইন্টারপ্রেটার আমাদের টেন্সরফ্লো লাইট মডেল আর জাভা ক্লাসের মধ্যে একটা ইন্টারফেস হিসেবে কাজ করে, যেটা দেয়া আছে এই লাইব্রেরিতে।
আমরা এখানে টেন্সরফ্লো লাইট ব্যবহার করছি সেটা দেখিয়ে দিতে হবে ডিপেন্ডেন্সিতে। যোগ করে দেই নিচের অংশটাকে।
৩. এরপর নিচের কোড ব্লকটা খুঁজে বের করি।
এখানে এই ব্লকে 'নো কম্প্রেস' অপশন যোগ করি।
৪. আমরা যখন অ্যান্ড্রয়েড অ্যাপ বাইনারি বানাবো, টেন্সরফ্লো লাইট মডেলটাকে কমপ্রেস করবো না। আমাদের মডেল ফাইলটা অপ্টিমাইজ না করেই মাত্র কয়েক কিলোবাইট। অবিশ্বাস্য, তাই না! ডান পাশে Sync Now বাটন চাপ দেই।
৫. টেন্সরফ্লো লাইট ইন্টারপ্রেটারকে ইনিশিয়ালাইজ করি
১. আমাদের অ্যান্ড্রয়েড অ্যাপে টেন্সরফ্লো লাইট চালাতে হবে দরকার হবে org.tensorflow.lite.Interpreter জাভা ক্লাস। ডোমেইনে উল্টো দিক থেকে বোঝা সহজ হবে। এখানে আমাদেরকে শুরুতে Interpreter ইনস্ট্যান্সকে ইনিশিয়ালাইজ করে নিতে হবে মডেলের জন্য।
২. অ্যান্ড্রয়েড স্টুডিওর বাঁ দিকে app মডিউলের নিচে দেখুন DigitClassifier যা আসলে ফাইল হিসেবে DigitClassifier.kt এক্সটেনশন হিসেবে আছে। এখানে আমাদের টেন্সরফ্লো লাইটের কোড যোগ করবো।
৩. শুরুতে DigitClassifier ক্লাসে একটা ফিল্ড যোগ করি।
৪. অ্যান্ড্রয়েড ষ্টুডিও একটা এরর দেবে এখানে। এররটা হতে পারে Unresolved reference: Interpreter, তবে সেটাকে মেটাবো import org.tensorflow.lite.Interpreter যোগ করে।
৫. নিচের কোডব্লক খুঁজে বের করি এখানে।
৬. ঠিক তার নিচে যোগ করে দেই নিচের লাইনগুলো। এই লাইনগুলো লোড করবে মডেল ফাইলটাকে। টেন্সরফ্লো লাইট ইন্টারপ্রেটারের একটা ইনস্ট্যান্স চালু হবে এখানে। mnist.tflite ফাইলটা আছে assets ফোল্ডারে। এখানে আমরা টেন্সরফ্লো লাইটকে এমনভাবে কনফিগার করেছি যাতে সে অ্যান্ড্রয়েড এর নিউরাল নেটওয়ার্ক এপিআই ব্যবহার করতে পারে - যদি মডেলের ইনফারেন্সকে স্পিডআপ করতে হার্ডওয়্যার এক্সেলারেশন দরকার হয়। মানে আমরা জিপিইউ এর কথা বলছিলাম।
৭. নিচের লাইনগুলো যোগ করে দেই // Read input shape from model file অংশের পরে।
modelInputSize
মানে হচ্ছে কতো বাইট মেমোরি আমরা অ্যালোকেট করবো ইনপুটকে স্টোর করার জন্য যা ব্যবহার হবে টেন্সরফ্লো লাইট মডেলের জন্য।
FLOAT_TYPE_SIZE
এর অর্থ হচ্ছে কত বাইট ইনপুট ডাটা টাইপ এর জন্য দরকার পড়বে। আমরা ব্যবহার করবো float32 মানে ৪ বাইট।
PIXEL_SIZE
বোঝাচ্ছে কতগুলো কালার চ্যানেল ব্যবহার করবো প্রতিটা পিক্সেলের জন্য। যেহেতু আমাদের ইমেজ মনোক্রোম সেকারণে আমরা ব্যবহার করছি ১টা কালার চ্যানেল।
৮. যেহেতু আমরা টেন্সরফ্লো লাইট ইন্টারপ্রেটারের কাজ শেষ, এটাকে বন্ধ করে দেবো রিসোর্স ফ্রি করে দেবার জন্য। ইন্টারপ্রেটারের লাইফ সাইকেল এক্টিভিটি MainActivity লাইফ সাইকেল এর সাথে সিনক্রোনাইজ হয়ে যাবার পর ইন্টারপ্রেটারকে ক্লোজ করে দেবো। আমরা খুঁজে বের করি নিচের কমেন্টটা।
৯. তারপর যোগ করি নিচের লাইনটা।
৬. টেন্সরফ্লো লাইট দিয়ে ইনফারেন্স চালাই ডিজিট চিনতে
যেহেতু আমাদের টেন্সরফ্লো লাইটের ইনফারেন্সকে কাজ করার মতো করে তৈরি করে ফেলেছি, তাই এখন এমন একটা ব্যবস্থা করতে হবে যাতে তাকে ইনপুট ইমেজ হিসেবে যা দেয়া হবে সেটাকে সে যেন চিনতে পারে। এখানে কি কি করা যায়?
১. ইনপুটকে প্রি-প্রসেস করতে হবে যাতে সে পিক্সেল ভ্যালুগুলোকে বুঝতে পারে। কি করতে হবে? Bitmap ইনস্ট্যান্সকে ByteBuffer ইনস্ট্যান্সএ কনভার্ট করতে হবে যার মধ্যে ইনপুট ইমেজের সব পিক্সেলের ভ্যালুগুলো থাকে। আমরা কেন ByteBuffer ব্যবহার করছি? কারণ এটা কোটলিন এর নেটিভ ফ্লোট মাল্টি-ডাইমেনশনাল অ্যারে থেকে দ্রুত কাজ করে।
২. এরপর ইনফারেন্স চালাবো। কারণ মডেল তো তৈরি হয়ে গেছে অনেক আগেই। মনে আছে সেই mnist.tflite ফাইলটার কথা? সেটাই ডিপ লার্নিং এর আউটকাম।
৩. আউটপুটের পোস্ট প্রসেসিং দরকার যাতে ডিপ লার্নিং এর প্রোবাবিলিটি অ্যারে এর আউটপুটটা মানুষের পড়ার মতো স্ট্রিং হিসেবে বের করে দেয়।
কিছু এডিট করি আবারো। একই ফাইলে। মনে আছে তো DigitClassifier.kt ফাইলটার কথা?
১. খুঁজে বের করি এই বিটম্যাপ কোডব্লকটাকে।
২. আমাদেরকে বলতে হবে কিভাবে ইনপুট বিটম্যাপ ইনস্ট্যান্সকে সে বাইটবাফার ইনস্ট্যান্সে কনভার্ট করে নেয় যাতে সে মডেলে ফিড করতে পারে।
৩. এখন প্রি-প্রসেস ইনপুট দিয়ে ইনফারেন্স চালাই।
৪. মডেলের আউটপুট থেকে সবচেয়ে বেশি প্রোবাবিলিটি যেই সংখ্যার জন্য আসবে সেটাই আমাদের পড়ার জন্য ফরম্যাটে দেখাবে। এর সঙ্গে প্রেডিকশন রেজাল্ট এবং কনফিডেন্স দেখাবে।
৭. আমাদের অ্যাপকে ডেপ্লয় করে দেখি কাজ করে কিনা?
টেস্ট করার সবচেয়ে ভালো জায়গা হচ্ছে অ্যান্ড্রয়েড ষ্টুডিওএর ইমুলেটরে। না হলে আসল মোবাইল ডিভাইসে টেস্ট করা কোন সমস্যা না।
১. অ্যান্ড্রয়েড ষ্টুডিওএর টুলবারে "রান" (সবুজ রঙের প্লে স্টাইলের বাটন)বাটন চাপ দিন। আমার হাতে একটা পুরানো স্যামসাং ফোন লাগিয়েছি পিসিতে। সেটা দেখাচ্ছে এখানে। হাতের কাছে ফোন না থাকলে একটা ইমুলেটর বেছে নিতে পারেন যেটা এখানে পিক্সেল ২ হিসেবে দেখানো আছে। পুরানো ফোনের সাপোর্টের জন্য অ্যান্ড্রয়েড ৭ এপিআই ২৪ ব্যবহার করেছি আমি।
২. সত্যিকারের ফোন হলে সরাসরি অ্যাপটা চালু হবে ইনস্টলেশনের পর পরই। আর ইমুলেটর হলে তো কথাই নেই। ছবি দেখুন।
৩. ফোন হলে আঙ্গুল দিয়ে যেকোন ডিজিটের ছবি আঁকুন। ইমুলেটর হলে মাউস দিয়ে একটা সংখ্যা আঁকুন ফোনের ড্রয়িং প্যাডে। কি দেখছেন? প্রেডিকশন রেজাল্ট এবং কনফিডেন্স কেমন দেখছেন? এটা কিন্তু মাত্র কয়েক কিলোবাইটের মডেলের রেজাল্ট। কোন অপটিমাইজেশন নেই এখানে।
আমার কাজ ছিলো দেখানো যে মোবাইল অ্যাপে কিভাবে ডিপ লার্নিং/মেশিন লার্নিং মডেল কাজ করে। অ্যান্ড্রয়েড অ্যাপ ডেভেলপমেন্ট নয়। আশা করছি আপনারা গুগল ফ্ল্যাটারের সাথে ফায়ারবেজের এমএল কিট দিয়ে আরো অনেক কিছু করতে পারবেন আজকের পর থেকে।