প্রোগ্রামিংয়ের কাজে ওপেনএআই, অ্যানথ্রোপিক ও অন্যান্য শীর্ষস্থানীয় এআই মডেলের চাহিদা ক্রমেই বাড়ছে। গুগলের প্রধান নির্বাহী কর্মকর্তা (সিইও) সুন্দর পিচাই গত অক্টোবরে জানান, তাদের কোম্পানির ২৫ শতাংশ নতুন কোড এআই দিয়ে তৈরি। মেটার সিইও মার্ক জাকারবার্গও জানান, সামাজিক যোগাযোগমাধ্যমে এআই কোডিং মডেল নিয়ে কাজ করতে তিনি ব্যাপকভাবে আগ্রহী।
তবে মাইক্রোসফটের এক গবেষণায় জানা গেছে, এ উন্নত এআই মডেলগুলো এখনো অনেক বাগ ঠিক করতে ব্যর্থ, যেগুলো একজন অভিজ্ঞ ডেভেলপারের কাছে খুব সাধারণ বিষয়। খবর টেকক্রাঞ্চ।
গবেষকরা এসডব্লিউই-বেঞ্চ লাইট নামের একটি সফটওয়্যার ডিবাগিং ব্যবহার করে অ্যানথ্রোপিকের ক্লাউড ৩.৭ সনেট, ওপেনএআইয়ের জিরো থ্রি মিনিসহ আরো নয়টি মডেল পরীক্ষা করেন। ৩০০টি বাগ সংশোধনের পরীক্ষায় অংশ নেয়া এজেন্টকে ডিবাগিং টুল যেমন পাইথন ডিবাগার ব্যবহার করার সুযোগ দেয়া হলেও অধিকাংশ মডেল অর্ধেক কাজও সফলভাবে সম্পন্ন করতে পারেনি।
সবচেয়ে ভালো পারফর্ম করেছে ক্লাউড ৩.৭ সনেট। এরপর ছিল ওপেনএআইয়ের জিরো ওয়ান ও জিরো থ্রি মিনি।
এমন ফলাফলের পেছনে মূল দুটি কারণ চিহ্নিত করেছেন গবেষকরা। একটি হলো অনেক মডেল বুঝতেই পারেনি কীভাবে ডিবাগিং টুলগুলো কার্যকরভাবে ব্যবহার করতে হয় বা কোন টুল কোন সমস্যা সমাধানে উপযুক্ত। সবচেয়ে বড় সমস্যাটি ছিল ডাটার ঘাটতি, বিশেষ করে সিকোয়েনশিয়াল ডিসিশন মেকিং প্রসেসর (ধাপে ধাপে কীভাবে মানুষ বাগ খুঁজে বের করে ও ঠিক করে, সে ধরনের ট্রেস ডাটা)।
গবেষণায় বলা হয়েছে, এ ঘাটতি পূরণে মডেলগুলোকে বিশেষ ধরনের ডাটা দিয়ে প্রশিক্ষণ দিতে হবে। উদাহরণস্বরূপ, এমন ডাটা প্রয়োজন, যেখানে দেখা যাবে একজন এজেন্ট কীভাবে ধাপে ধাপে ডিবাগার ব্যবহার করে তথ্য সংগ্রহ করছে এবং শেষে বাগের সমাধান দিচ্ছে।
এটি নতুন কিছু নয়, অনেক আগেই গবেষণায় উঠে এসেছে যে কোড লেখার সময় এআই প্রায়ই ভুল করে, এমনকি নিরাপত্তা ঝুঁকিও তৈরি করে। যেমন ডেভিন নামে জনপ্রিয় একটি এআই টুল ২০টি প্রোগ্রামিং টেস্টের মধ্যে তিনটি সফলভাবে সম্পন্ন করতে পেরেছে।
মাইক্রোসফটের এ গবেষণায় একটি বিষয় স্পষ্ট, তা হলো এআই সফটওয়্যার ডিবাগিংয়ে মানুষের বিকল্প হতে পারে না। যদিও এ গবেষণার ফলাফল হয়তো এআই কোডিং টুলে বিনিয়োগকারীদের উৎসাহ কমাবে না, তবে ডেভেলপার ও ম্যানেজারদের এআইয়ের ওপর অন্ধ বিশ্বাস রাখার আগে দ্বিতীয়বার ভাবতে বাধ্য করবে।