কোম্পানিগুলো আবিষ্কার করছে যে AI এজেন্ট তৈরি করা সহজ, কিন্তু এমন সিস্টেম তৈরি করা কঠিন যা সেই এজেন্টগুলোকে প্রোডাকশনে বিশ্বস্ত করে তোলে।
এন্টারপ্রাইজ AI টিমগুলো গত দুই বছর ধরে এজেন্ট তৈরির প্রতিযোগিতায় ছিল। এখন তারা একটি ভিন্ন সমস্যায় পড়েছে: সেই এজেন্টগুলোর মধ্যে খুব কমই বৃহৎ পরিসরে আসলে বিশ্বাসযোগ্য।

এই ব্যবধান এখন প্রকাশ্য সংখ্যায় দেখা যাচ্ছে। জানা গেছে Prosus অভ্যন্তরীণভাবে ৫০,০০০ এজেন্ট তৈরি করেছে, কিন্তু প্রতিদিন মাত্র প্রায় ৫,০০০ চলছে। সেই ১০-থেকে-১ অনুপাত এন্টারপ্রাইজ AI প্রোডাকশনের বর্তমান অবস্থার একটি উন্মোচনকারী মেট্রিক হয়ে উঠেছে। সমস্যা এটি নয় যে কোম্পানিগুলো এজেন্ট তৈরি করতে পারে কিনা। সমস্যা হলো তারা নির্ভরযোগ্যভাবে নির্ধারণ করতে পারে কিনা যে কোন এজেন্টগুলো ডিপ্লয় করা নিরাপদ, কোন আউটপুটগুলো বিশ্বাসযোগ্য, এবং সিস্টেম ব্যর্থ হলে কী হবে।
এই পার্থক্য গুরুত্বপূর্ণ কারণ স্বায়ত্তশাসিত সিস্টেমের প্রতিশ্রুত দক্ষতা এই অনুমানের উপর নির্ভর করে যে সিস্টেমগুলো প্রথম স্থানে সঠিক সিদ্ধান্ত নিচ্ছে।
পরীক্ষা-নিরীক্ষা থেকে প্রোডাকশনের ব্যবধান
অনেক ইঞ্জিনিয়ারিং টিমের জন্য, AI এজেন্ট ডিপ্লয়মেন্টের প্রথম ঢেউ দ্রুত এগিয়ে গেছে। অভ্যন্তরীণ কোপাইলট, ওয়ার্কফ্লো অটোমেটর এবং মাল্টি-এজেন্ট সিস্টেম বিভিন্ন বিভাগে আবির্ভূত হয়েছে। ডেমোগুলো কাজ করেছে। পাইলট প্রোগ্রামগুলো আশাব্যঞ্জক দেখাচ্ছিল।
প্রোডাকশন পরিবেশ ভিন্ন গল্প বলেছে।
bem-এর সিইও Antonio Bustamante বিমা, অর্থ এবং স্বাস্থ্যসেবা সহ নিয়ন্ত্রিত শিল্পগুলোর জন্য AI অবকাঠামোতে বছরের পর বছর কাজ করেছেন। তার দৃষ্টিকোণ থেকে, শিল্পের সবচেয়ে বড় বাধা হলো জবাবদিহিতা।
তিনি Upstream-এর সাথে জড়িত একটি বহুল আলোচিত ঘটনার দিকে ইঙ্গিত করেন, যেখানে একটি AI এজেন্ট একটি Slack চ্যানেলে যোগ দিয়েছিল, এবং মানব টিম কথিতভাবে ২৪ ঘণ্টার জন্য নীরব হয়ে গিয়েছিল কারণ কেউ জানত না কীভাবে এটির সাথে ইন্টারঅ্যাক্ট করতে হবে। Bustamante যুক্তি দেন যে নীরবতা আরও গভীর কিছু উন্মোচন করেছে: কোম্পানিগুলো এজেন্টদের পাশাপাশি কাজ করার জন্য অপারেশনাল মডেল ডিজাইন করেনি।
একই প্যাটার্ন বড় মাপের এন্টারপ্রাইজ ডিপ্লয়মেন্টের মধ্যে দেখা যায়। টিমগুলো দ্রুত হাজার হাজার এজেন্ট তৈরি করতে পারে, কিন্তু ব্যবহার কমে যায় যখন সেই সিস্টেমগুলো অগোছালো প্রোডাকশন ডেটা, অস্পষ্ট মালিকানা বা অনিশ্চিত আউটপুটের সম্মুখীন হয়।
এই কারণেই অনেক কোম্পানি এখন নিজেদের এমন অবস্থায় দেখছে যে ব্যাপক AI এজেন্ট ডিপ্লয়মেন্ট প্রচেষ্টা আছে কিন্তু প্রকৃত এন্টারপ্রাইজ AI প্রোডাকশন তুলনামূলকভাবে কম।
কেন মাল্টি-এজেন্ট সিস্টেম বারবার থমকে যাচ্ছে
সমস্যার একটি অংশ আসে এন্টারপ্রাইজ পরিবেশ আসলে কীভাবে কাজ করে তা থেকে।
নিয়ন্ত্রিত ডেমোতে, ডেটা পরিষ্কার এবং ওয়ার্কফ্লো পূর্বানুমানযোগ্য। বাস্তব সংগঠনগুলো খুব কমই এভাবে কাজ করে। বেশিরভাগ এন্টারপ্রাইজ সিস্টেমে বিভক্ত রেকর্ড, অসামঞ্জস্যপূর্ণ ফর্ম্যাট, অনুপস্থিত প্রসঙ্গ এবং বছরের পর বছর জমে থাকা অপারেশনাল ওয়ার্কঅ্যারাউন্ড রয়েছে।
Bustamante পরিস্থিতিটিকে অ্যাসেম্বলি লাইনের সাথে তুলনা করেন। Henry Ford-এর উৎপাদন মডেল সফল হয়েছিল কারণ উৎপাদন স্কেল করার আগে ইনপুটগুলো মানসম্পন্ন করা হয়েছিল। মাল্টি-এজেন্ট সিস্টেম বিপরীত পরিস্থিতির মুখোমুখি। তাদের অ-মানসম্পন্ন এন্টারপ্রাইজ ডেটায় কাজ করতে হয়, যা বেশিরভাগ এন্টারপ্রাইজ পরিবেশের বৈশিষ্ট্য।
কিছু কোম্পানি ইতিমধ্যে প্রকাশ্যে অপারেশনাল বোঝা স্বীকার করেছে। বেশ কয়েকটি ডিপ্লয়মেন্টে, সংগঠনগুলো নিজেদের ক্রমাগত এজেন্ট আউটপুট পর্যালোচনা করার জন্য মানব পর্যালোচক নিয়োগ করতে দেখেছে। শিল্পে প্রচলিত একটি উদাহরণে, একটি মাল্টি-এজেন্ট সিস্টেমের কথিতভাবে পর্দার আড়ালে ফলাফল যাচাই করতে ২০ জন মানুষের প্রয়োজন ছিল।
এটি সম্পূর্ণরূপে অর্থনীতি পরিবর্তন করে দেয়। স্বায়ত্তশাসিত এজেন্ট ডিপ্লয় করার প্রতিশ্রুত লাভ অদৃশ্য হয়ে যায় যদি মানুষকে এখনও প্রতিটি সিদ্ধান্ত ম্যানুয়ালি যাচাই করতে হয়।
কনফিডেন্স স্কোরিং এবং অনুপস্থিত জবাবদিহিতার স্তর
Bustamante যুক্তি দেন যে কনফিডেন্স স্কোরিং AI গভর্ন্যান্স এবং AI অবকাঠামো প্রোডাকশনে সবচেয়ে উপেক্ষিত উপাদানগুলোর একটি হয়ে উঠেছে। অনিশ্চয়তা পরিমাপ করতে পারে এমন সিস্টেম ছাড়া, অপারেটরদের কাছে কোন নির্ভরযোগ্য উপায় নেই যে কোন এজেন্টগুলো প্রোডাকশন-প্রস্তুত এবং কোনগুলোর হস্তক্ষেপ প্রয়োজন তা নির্ধারণ করতে।
বাস্তবে, কনফিডেন্স স্কোরিং মানে একটি উত্তরে শতাংশ নির্ধারণের চেয়ে বেশি। এটির জন্য এমন সিস্টেম প্রয়োজন যা অনিশ্চয়তা ব্যাখ্যা করতে পারে, সিদ্ধান্তগুলোকে উৎস ডেটায় ফিরিয়ে ট্রেস করতে পারে এবং ওয়ার্কফ্লো জুড়ে ত্রুটি জমার আগে হিউম্যান-ইন-দ্য-লুপ চেকপয়েন্ট তৈরি করতে পারে।
AI জবাবদিহিতার সেই স্তর বিশেষভাবে গুরুত্বপূর্ণ হয়ে ওঠে এমন শিল্পগুলোতে যেখানে ভুলের আর্থিক বা আইনি পরিণতি রয়েছে। একটি ব্যর্থ বিমা দাবি পর্যালোচনা, স্বাস্থ্যসেবা নিষ্কাশন ত্রুটি, বা আর্থিক প্রক্রিয়াকরণ ভুল একটি দায়বদ্ধতার ঘটনা হয়ে উঠতে পারে।
Bustamante bem-এর বৃহত্তর থিসিসকে "যে জিনিসগুলো ব্যর্থ হতে পারে না তার জন্য এজেন্ট অর্কেস্ট্রেশন প্ল্যাটফর্ম" হিসেবে বর্ণনা করেন। বাক্যাংশটি শিল্প জুড়ে একটি ক্রমবর্ধমান উপলব্ধি প্রতিফলিত করে: AI এজেন্ট নির্ভরযোগ্যতা আপনি কতগুলো এজেন্ট ডিপ্লয় করেন তার উপর কম নির্ভর করে এবং আপনি কিছু ভুল হলে সিদ্ধান্তগুলো ট্রেস, অডিট এবং সংশোধন করতে পারেন কিনা তার উপর বেশি নির্ভর করে।
প্রোডাকশন-প্রস্তুত অবকাঠামো কেমন দেখায়
এন্টারপ্রাইজ AI-এর পরবর্তী পর্যায়ের আরও এজেন্ট তৈরির সাথে কম এবং তাদের চারপাশে সিস্টেম তৈরির সাথে বেশি সম্পর্ক থাকতে পারে।
দীর্ঘমেয়াদী AI এজেন্ট ব্যবহারে মনোযোগী কোম্পানিগুলো ক্রমবর্ধমানভাবে এমন অবকাঠামো খুঁজছে যা কার্যকরীভাবে নমনীয় থাকে, ফলাফলে দৃঢ়, এবং ব্যর্থতার পরিস্থিতিতে ট্রেসযোগ্য। এতে কনফিডেন্স স্কোরিং, অডিট ট্রেইল, হস্তক্ষেপ পয়েন্ট, ডেটা স্ট্যান্ডার্ডাইজেশন এবং প্রোডাকশনের জন্য ডিজাইন করা গভর্ন্যান্স সিস্টেম অন্তর্ভুক্ত, ডেমোর জন্য নয়।
যে কোম্পানিগুলো মাল্টি-এজেন্ট সিস্টেম পরীক্ষা-নিরীক্ষা এবং বাস্তব-বিশ্ব ডিপ্লয়মেন্টের মধ্যে ব্যবধান বন্ধ করে সেগুলো হয়তো সবচেয়ে বেশি এজেন্ট আছে এমন কোম্পানি নয়। তারা হয়তো সেই কোম্পানিগুলো যারা শেষ পর্যন্ত সেই জবাবদিহিতার অবকাঠামো তৈরি করে যা এন্টারপ্রাইজগুলো প্রথমবারে এড়িয়ে গিয়েছিল।







