অ্যাক্যুরেসি, লিস্ট স্কয়ার রিগ্রেশন
Last updated
Last updated
The process of learning from data to find a solution to a question is machine learning.
-- Siraj Raval
আচ্ছা, আমরা কিভাবে কমাবো এই "এরর"? আমাদের কাছে আসল ডেটা আছে, সঙ্গে এসেছে তার প্রেডিক্টেড ভ্যালু। এর মানে এই দুটোর ফারাক কতো কমিয়ে নিয়ে আসা যায় সেটাকে আমরা মেশিন লার্নিং স্টাইলে 'লস ফাংশন' বলতে পারি। আর বড় গল্প দিতে চাচ্ছিনা, বরং আমরা এমন একটা সরল রেখা চাই যেটা প্রেডিক্টেড সরল রেখা থেকে কম ভুল করবে। সেটার একটা সহজ পদ্ধতি হচ্ছে এররের সব যোগের স্কয়ার। না বোঝারই কথা। তাহলে চলুন এই ফর্মুলায়। ভয় পাবার কিছু নেই। পরের ফর্মুলাটা আমাদের মতো করে বানিয়েছি আগেরটাকে সোজা করতে গিয়ে। ভয় পাবেন না। পরেরটাই সোজা।
আগে বের করি m স্লোপ, (একটু সহজ করে নিলাম আমাদের জন্য)
x এর সব ভ্যালুগুলোকে বসিয়ে দেখি কি আসে? শুরুতে আমরা ক্যালকুলেট করবো (x-xmean), ঠিক তো?
x এর মানের পর y এর ভ্যালু ঢুকিয়ে দেখি ফর্মুলাতে। আমাদের ফর্মুলা হচ্ছে (y-ymean), কি বলেন?
আমাদের হাতে চলে এসেছে সব ভ্যালু। এখন (x-xmean)*(y-ymean) বের করার পালা।
ফর্মুলার ওপরের অংশ শেষ। চলুন নিচের অংশে। আমাদেরকে ক্যালকুলেট করতে হবে Sum_of(x-xmean)**2 অংশটুকু। বর্গ করতে হবে সবগুলো আলাদা আলাদা করে।
এখন দুটো অংশই পেয়ে গেলাম। দুটোকে কানেক্ট করার পালা।
m পেয়ে গেলাম। এখন y-ইন্টারসেপ্ট বের করার জন্য আমাদের ফর্মুলা কী? তার আগে b এর মান বের করি। ফর্মুলা হচ্ছে b = ymean — m * xmean, ঠিক তো?
ভালো কথা, এখন আমাদেরকে প্রেডিক্ট করতে হবে প্রতিটা y এর ভ্যালুকে নতুন m এবং b থেকে। তার আগে বের করি y = mx + b ।
এখন আমরা দেখবো x এর আগের মান দিয়ে y এর নতুন প্রেডিক্টেড ভ্যালু কতো হতে পারে। প্রতিটা y এর নতুন ভ্যালুগুলো দেখি বরং। আমাদের প্রতিটা প্রেডিক্টেড y ভ্যালুর চেঞ্জ দেখতে চাই যখন ফর্মুলা y = 19.2x + (-22.4) আমাদের x এর ভ্যালু দিয়ে।
কাজ কিন্তু গুছিয়ে এনেছি আমরা। x এর সাথে y এর নতুন ভ্যালু পেয়েছি এখানে। নতুন ভ্যালুগুলো প্লট করি বরং।
আগের লাইনটাকে ফিরে নিয়ে আসি। কী দেখলেন? অনেক এরর। নতুন লাইনে কমে গেছে অনেক এরর।
আমরা যেটা দেখছি, এই নতুন ভ্যালুগুলো কিন্তু আসল বাঁকা লাইনটার কাছাকাছি। আবার আগের শুরুর পয়েন্ট থেকে শেষ পয়েন্ট পর্যন্ত আরেকটা সোজা লাইনের বেশ কাছাকাছি চলে এসেছে নতুন লাইন। দূরত্ব কম মানে, কম এরর।
x ভ্যালু
y ভ্যালু
আসল ভ্যালু
এরর
স্কয়ার এরর
1
4
4
0
0
2
12
23
-11
121