MaGGIe I-HIM50K এবং M-HIM2K ডেটাসেট প্রবর্তন করে, যাতে ইনস্ট্যান্স ম্যাটিং দৃঢ়তা মূল্যায়ন করতে ১,৮০,০০০-এর বেশি সংশ্লেষিত মানব মাস্ক রয়েছে।MaGGIe I-HIM50K এবং M-HIM2K ডেটাসেট প্রবর্তন করে, যাতে ইনস্ট্যান্স ম্যাটিং দৃঢ়তা মূল্যায়ন করতে ১,৮০,০০০-এর বেশি সংশ্লেষিত মানব মাস্ক রয়েছে।

MaskRCNN এবং BG20K দিয়ে মাল্টি-ইনস্ট্যান্স হিউম্যান ম্যাটিং ডেটা সংশ্লেষণ

2025/12/20 02:30

সারসংক্ষেপ এবং ১. ভূমিকা

  1. সম্পর্কিত কাজসমূহ

  2. MaGGIe

    ৩.১. দক্ষ মাস্কড গাইডেড ইনস্ট্যান্স ম্যাটিং

    ৩.২. ফিচার-ম্যাট টেম্পোরাল সামঞ্জস্য

  3. ইনস্ট্যান্স ম্যাটিং ডেটাসেট

    ৪.১. ইমেজ ইনস্ট্যান্স ম্যাটিং এবং ৪.২. ভিডিও ইনস্ট্যান্স ম্যাটিং

  4. পরীক্ষা-নিরীক্ষা

    ৫.১. ইমেজ ডেটার উপর প্রি-ট্রেনিং

    ৫.২. ভিডিও ডেটার উপর ট্রেনিং

  5. আলোচনা এবং তথ্যসূত্র

\ সম্পূরক উপাদান

  1. আর্কিটেকচার বিস্তারিত

  2. ইমেজ ম্যাটিং

    ৮.১. ডেটাসেট তৈরি এবং প্রস্তুতি

    ৮.২. ট্রেনিং বিস্তারিত

    ৮.৩. পরিমাণগত বিস্তারিত

    ৮.৪. প্রাকৃতিক ছবিতে আরও গুণগত ফলাফল

  3. ভিডিও ম্যাটিং

    ৯.১. ডেটাসেট তৈরি

    ৯.২. ট্রেনিং বিস্তারিত

    ৯.৩. পরিমাণগত বিস্তারিত

    ৯.৪. আরও গুণগত ফলাফল

৮. ইমেজ ম্যাটিং

এই বিভাগটি ইমেজ ম্যাটিং প্রক্রিয়া সম্প্রসারিত করে, ডেটাসেট তৈরি এবং বিদ্যমান পদ্ধতিগুলির সাথে ব্যাপক তুলনার অতিরিক্ত অন্তর্দৃষ্টি প্রদান করে। আমরা I-HIM50K এবং M-HIM2K ডেটাসেট তৈরিতে গভীরভাবে প্রবেশ করি, বিস্তারিত পরিমাণগত বিশ্লেষণ প্রদান করি এবং আমাদের পদ্ধতির কার্যকারিতা তুলে ধরতে আরও গুণগত ফলাফল উপস্থাপন করি।

৮.১. ডেটাসেট তৈরি এবং প্রস্তুতি

I-HIM50K ডেটাসেট HHM50K [50] ডেটাসেট থেকে সংশ্লেষিত হয়েছিল, যা মানব ইমেজ ম্যাটের বিস্তৃত সংগ্রহের জন্য পরিচিত। আমরা একক-ব্যক্তির ছবি ফিল্টার করতে COCO ডেটাসেটে প্রশিক্ষিত একটি MaskRCNN [14] Resnet-50 FPN 3x মডেল ব্যবহার করেছি, যার ফলে ৩৫,০৫৩টি ছবির একটি উপসেট পাওয়া গেছে। InstMatt [49] পদ্ধতি অনুসরণ করে, এই ছবিগুলি BG20K [29] ডেটাসেট থেকে বিভিন্ন পটভূমির বিপরীতে কম্পোজিট করা হয়েছিল, প্রতিটি ছবিতে ২-৫টি বিষয় সহ মাল্টি-ইনস্ট্যান্স পরিস্থিতি তৈরি করে। বিষয়গুলি একটি বাস্তবসম্মত স্কেল বজায় রাখতে এবং অতিরিক্ত ওভারল্যাপ এড়াতে আকার পরিবর্তন এবং অবস্থান করা হয়েছিল, যেমন ইনস্ট্যান্স IoU ৩০% অতিক্রম করে না। এই প্রক্রিয়াটি ৪৯,৭৩৭টি ছবি তৈরি করেছে, প্রতিটি ছবিতে গড়ে ২.২৮টি ইনস্ট্যান্স রয়েছে। ট্রেনিংয়ের সময়, আলফা ম্যাট বাইনারাইজ করে এবং এলোমেলো ড্রপআউট, ডাইলেশন এবং ইরোশন অপারেশন প্রয়োগ করে গাইডেন্স মাস্ক তৈরি করা হয়েছিল। I-HIM50K থেকে নমুনা ছবি চিত্র ১০-এ প্রদর্শিত হয়েছে।

\ M-HIM2K ডেটাসেট বিভিন্ন মাস্ক গুণমানের বিপরীতে মডেল দৃঢ়তা পরীক্ষা করার জন্য ডিজাইন করা হয়েছিল। এটি বিভিন্ন MaskRCNN মডেল ব্যবহার করে তৈরি প্রতিটি ইনস্ট্যান্সে দশটি মাস্ক নিয়ে গঠিত। এই তৈরি প্রক্রিয়ার জন্য ব্যবহৃত মডেল সম্পর্কে আরও তথ্য সারণি ৮-এ দেখানো হয়েছে। মাস্কগুলি গ্রাউন্ড ট্রুথ আলফা ম্যাটের সাথে সর্বোচ্চ IoU এর ভিত্তিতে ইনস্ট্যান্সের সাথে মিলানো হয়েছিল, ন্যূনতম IoU থ্রেশহোল্ড ৭০% নিশ্চিত করে। যে মাস্কগুলি এই থ্রেশহোল্ড পূরণ করেনি সেগুলি গ্রাউন্ড ট্রুথ থেকে কৃত্রিমভাবে তৈরি করা হয়েছিল। এই প্রক্রিয়াটি ১,৩৪,২৪০টি মাস্কের একটি ব্যাপক সেট তৈরি করেছে, যার মধ্যে কম্পোজিটের জন্য ১,১৭,৬৬০টি এবং প্রাকৃতিক ছবির জন্য ১৬,৬০০টি, মাস্কড গাইডেড ইনস্ট্যান্স ম্যাটিং মূল্যায়নের জন্য একটি শক্তিশালী বেঞ্চমার্ক প্রদান করে। সম্পূর্ণ ডেটাসেট I-HIM50K এবং M-HIM2K এই কাজের গ্রহণযোগ্যতার পরে প্রকাশ করা হবে।

\ চিত্র ১০. I-HIM50K ডেটাসেটের উদাহরণ। (রঙে সেরা দেখা যায়।)

\ সারণি ৮. MHIM2K-তে বিভিন্ন মাস্ক গুণমান সহ দশটি মডেল ব্যবহার করা হয়েছে। MaskRCNN মডেলগুলি বিভিন্ন সেটিংস সহ COCO-তে প্রশিক্ষিত detectron2 থেকে নেওয়া হয়েছে।

\

:::info লেখকগণ:

(১) Chuong Huynh, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক (chuonghm@cs.umd.edu);

(২) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);

(৩) Abhinav Shrivastava, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক (abhinav@cs.umd.edu);

(৪) Joon-Young Lee, Adobe Research (jolee@adobe.com)।

:::


:::info এই গবেষণাপত্রটি CC by 4.0 Deed (Attribution 4.0 International) লাইসেন্সের অধীনে arxiv-এ উপলব্ধ

:::

\

মার্কেটের সুযোগ
Multichain লোগো
Multichain প্রাইস(MULTI)
$0.03833
$0.03833$0.03833
+2.98%
USD
Multichain (MULTI) লাইভ প্রাইস চার্ট
ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য service@support.mexc.com এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

পিটার ব্র্যান্ড কেন বলছেন মার্কিন ক্রিপ্টো বিল গেম-চেঞ্জার হবে না

পিটার ব্র্যান্ড কেন বলছেন মার্কিন ক্রিপ্টো বিল গেম-চেঞ্জার হবে না

পোস্টটি Why Peter Brandt Says The US Crypto Bill Won't Be A Game-Changer BitcoinEthereumNews.com-এ প্রকাশিত হয়েছে। একটি যুগান্তকারী US ক্রিপ্টো বিল কি Bitcoin-কে আকাশচুম্বী করবে
শেয়ার করুন
BitcoinEthereumNews2025/12/20 08:21
সোলানা মূল্য বিশ্লেষণ: SOL $125 সাপোর্ট পুনরুদ্ধার করেছে যেহেতু বুলরা $148-এর দিকে অগ্রসর হওয়ার দিকে নজর রাখছে

সোলানা মূল্য বিশ্লেষণ: SOL $125 সাপোর্ট পুনরুদ্ধার করেছে যেহেতু বুলরা $148-এর দিকে অগ্রসর হওয়ার দিকে নজর রাখছে

$125 সাপোর্ট এরিয়া থেকে রিবাউন্ড দেখার পর, Solana (SOL) আবার বুলিশ অবস্থানে ফিরে এসেছে কারণ তাদের সাম্প্রতিকতম দৈনিক ক্যান্ডেল গ্রিন ক্লোজ হয়েছে, যেহেতু ক্রেতারা দেখাচ্ছে
শেয়ার করুন
Tronweekly2025/12/20 09:30
ক্যারোলিন এলিসনসহ তিনজন সাবেক FTX নির্বাহী SEC জরিমানা গ্রহণ করেছেন এবং নিষ্পত্তি চুক্তিতে স্বাক্ষর করেছেন, এবং ৮-১০ বছরের জন্য নির্বাহী বা পরিচালক হিসেবে দায়িত্ব পালনে নিষিদ্ধ হয়েছেন।

ক্যারোলিন এলিসনসহ তিনজন সাবেক FTX নির্বাহী SEC জরিমানা গ্রহণ করেছেন এবং নিষ্পত্তি চুক্তিতে স্বাক্ষর করেছেন, এবং ৮-১০ বছরের জন্য নির্বাহী বা পরিচালক হিসেবে দায়িত্ব পালনে নিষিদ্ধ হয়েছেন।

PANews ২০ ডিসেম্বর রিপোর্ট করেছে যে, Coindesk অনুযায়ী, মার্কিন সিকিউরিটিজ অ্যান্ড এক্সচেঞ্জ কমিশন (SEC) একটি মামলার নোটিশ জারি করেছে যাতে উল্লেখ করা হয়েছে যে তিনজন প্রাক্তন
শেয়ার করুন
PANews2025/12/20 08:39