Anyscale-এর Ray Serve LLM আপডেট vLLM WideEP ডিপ্লয়মেন্টের জন্য DP গ্রুপ ফল্ট টলারেন্স সক্ষম করে, যা বিতরণকৃত AI ইনফারেন্স সিস্টেমের ডাউনটাইম ঝুঁকি হ্রাস করে। (ReadAnyscale-এর Ray Serve LLM আপডেট vLLM WideEP ডিপ্লয়মেন্টের জন্য DP গ্রুপ ফল্ট টলারেন্স সক্ষম করে, যা বিতরণকৃত AI ইনফারেন্স সিস্টেমের ডাউনটাইম ঝুঁকি হ্রাস করে। (Read

Ray 2.55 বড় আকারের AI মডেল ডিপ্লয়মেন্টের জন্য ফল্ট টলারেন্স যোগ করেছে

2026/04/03 02:35
3 মিনিটে পড়া যাবে
এই বিষয়বস্তু সম্পর্কে মতামত বা উদ্বেগ জানাতে, অনুগ্রহ করে আমাদের সাথে crypto.news@mexc.com ঠিকানায় যোগাযোগ করুন

Ray 2.55 বড় মাপের AI মডেল স্থাপনার জন্য ফল্ট টলারেন্স যোগ করেছে

Joerg Hiller এপ্রিল ০২, ২০২৬ ১৮:৩৫

Anyscale-এর Ray Serve LLM আপডেট vLLM WideEP স্থাপনার জন্য DP গ্রুপ ফল্ট টলারেন্স সক্ষম করে, বিতরণকৃত AI ইনফারেন্স সিস্টেমের জন্য ডাউনটাইম ঝুঁকি হ্রাস করে।

Ray 2.55 বড় মাপের AI মডেল স্থাপনার জন্য ফল্ট টলারেন্স যোগ করেছে

Anyscale তার Ray Serve LLM ফ্রেমওয়ার্কে একটি গুরুত্বপূর্ণ আপডেট প্রকাশ করেছে যা বড় মাপের AI ইনফারেন্স ওয়ার্কলোড চালানো প্রতিষ্ঠানগুলির জন্য একটি গুরুত্বপূর্ণ অপারেশনাল চ্যালেঞ্জ সমাধান করে। Ray 2.55 vLLM ওয়াইড এক্সপার্ট প্যারালেলিজম স্থাপনার জন্য ডেটা প্যারালেল (DP) গ্রুপ ফল্ট টলারেন্স প্রবর্তন করে—একটি বৈশিষ্ট্য যা একক GPU ব্যর্থতাকে সম্পূর্ণ মডেল সার্ভিং ক্লাস্টার বন্ধ হওয়া থেকে প্রতিরোধ করে।

আপডেটটি মিক্সচার অফ এক্সপার্টস (MoE) মডেল সার্ভিংয়ের একটি নির্দিষ্ট সমস্যাকে লক্ষ্য করে। ট্র্যাডিশনাল মডেল স্থাপনার বিপরীতে যেখানে প্রতিটি রেপ্লিকা স্বাধীনভাবে কাজ করে, DeepSeek-V3-এর মতো MoE আর্কিটেকচার এক্সপার্ট লেয়ারগুলিকে GPU-এর গ্রুপ জুড়ে শার্ড করে যা সম্মিলিতভাবে কাজ করতে হয়। যখন এই কনফিগারেশনে একটি GPU ব্যর্থ হয়, তখন সম্পূর্ণ গ্রুপ—সম্ভাব্যভাবে 16 থেকে 128 GPU জুড়ে—অকার্যকর হয়ে পড়ে।

প্রযুক্তিগত সমস্যা

MoE মডেলগুলি একাধিক GPU জুড়ে বিশেষায়িত "এক্সপার্ট" নিউরাল নেটওয়ার্ক বিতরণ করে। উদাহরণস্বরূপ, DeepSeek-V3 প্রতি লেয়ারে 256টি এক্সপার্ট ধারণ করে কিন্তু প্রতি টোকেনে মাত্র 8টি সক্রিয় করে। টোকেনগুলি যেকোনো GPU-তে রাউট হয় যা প্রয়োজনীয় এক্সপার্টদের ডিসপ্যাচ এবং কম্বাইন অপারেশনের মাধ্যমে ধারণ করে যার জন্য সমস্ত অংশগ্রহণকারী র‍্যাঙ্কগুলিকে সুস্থ থাকতে হয়।

পূর্বে, একক র‍্যাঙ্ক ব্যর্থতা এই সম্মিলিত অপারেশনগুলি ভেঙে ফেলত। প্রভাবিত গ্রুপে বেঁচে থাকা রেপ্লিকাগুলিতে কোয়েরি রাউটিং অব্যাহত থাকত, কিন্তু প্রতিটি রিকোয়েস্ট ব্যর্থ হত। পুনরুদ্ধারের জন্য সম্পূর্ণ সিস্টেম পুনরায় চালু করা প্রয়োজন ছিল।

Ray কীভাবে এটি সমাধান করে

Ray Serve LLM এখন গ্যাং শিডিউলিংয়ের মাধ্যমে প্রতিটি DP গ্রুপকে একটি পারমাণবিক ইউনিট হিসাবে বিবেচনা করে। যখন একটি র‍্যাঙ্ক ব্যর্থ হয়, তখন সিস্টেমটি সম্পূর্ণ গ্রুপকে অসুস্থ হিসাবে চিহ্নিত করে, এতে ট্রাফিক রাউটিং বন্ধ করে, ব্যর্থ গ্রুপটি ভেঙে ফেলে এবং এটিকে একটি ইউনিট হিসাবে পুনর্নির্মাণ করে। অন্যান্য সুস্থ গ্রুপগুলি সর্বত্র রিকোয়েস্ট সার্ভিং চালিয়ে যায়।

বৈশিষ্ট্যটি Ray 2.55-এ ডিফল্টরূপে সক্ষম হয়ে শিপ করে। বিদ্যমান DP স্থাপনার জন্য কোনো কোড পরিবর্তনের প্রয়োজন নেই—ফ্রেমওয়ার্কটি স্বয়ংক্রিয়ভাবে গ্রুপ-স্তরের স্বাস্থ্য পরীক্ষা, শিডিউলিং এবং পুনরুদ্ধার পরিচালনা করে।

অটোস্কেলিং এই সীমানাগুলিকেও সম্মান করে। স্কেল-আপ এবং স্কেল-ডাউন অপারেশনগুলি পৃথক রেপ্লিকার পরিবর্তে গ্রুপ-আকারের বৃদ্ধিতে ঘটে, যা আংশিক গ্রুপের তৈরি প্রতিরোধ করে যা ট্রাফিক সার্ভ করতে পারে না।

অপারেশনাল প্রভাব

আপডেটটি একটি গুরুত্বপূর্ণ ডিজাইন বিবেচনা তৈরি করে: গ্রুপের প্রশস্ততা বনাম গ্রুপের সংখ্যা। Anyscale দ্বারা উদ্ধৃত vLLM বেঞ্চমার্ক অনুসারে, প্রতি GPU থ্রুপুট 32, 72, এবং 96 এর এক্সপার্ট প্যারালেল সাইজ জুড়ে তুলনামূলকভাবে স্থিতিশীল থাকে। এর অর্থ হল অপারেটররা দক্ষতা ত্যাগ না করে ছোট গ্রুপের দিকে টিউন করতে পারেন—এবং ছোট গ্রুপের অর্থ ব্যর্থতা ঘটলে ছোট ব্লাস্ট রেডিআই।

Anyscale উল্লেখ করে যে এই অর্কেস্ট্রেশন-স্তরের স্থিতিস্থাপকতা vLLM কমিউনিটিতে ঘটছে ইঞ্জিন-স্তরের ইলাস্টিসিটি কাজের পরিপূরক। vLLM ইলাস্টিক এক্সপার্ট প্যারালেলিজম RFC এ সম্বোধন করে যে কীভাবে রানটাইম একটি গ্রুপের মধ্যে গতিশীলভাবে টপোলজি সামঞ্জস্য করতে পারে, যখন Ray Serve LLM পরিচালনা করে কোন গ্রুপগুলি বিদ্যমান এবং ট্রাফিক গ্রহণ করে।

বড় মাপে DeepSeek-স্টাইল মডেল স্থাপন করা প্রতিষ্ঠানগুলির জন্য, ব্যবহারিক সুবিধা সরল: GPU ব্যর্থতাগুলি সিস্টেম-ব্যাপী বিভ্রাটের পরিবর্তে স্থানীয় ঘটনায় পরিণত হয়। কোড নমুনা এবং পুনরুত্পাদন পদক্ষেপগুলি Anyscale-এর GitHub রিপোজিটরিতে উপলব্ধ।

চিত্র সূত্র: Shutterstock
  • ray
  • vllm
  • এআই অবকাঠামো
  • মেশিন লার্নিং
  • বিতরণকৃত কম্পিউটিং
মার্কেটের সুযোগ
Raydium লোগো
Raydium প্রাইস(RAY)
$0.698
$0.698$0.698
+0.21%
USD
Raydium (RAY) লাইভ প্রাইস চার্ট

World Cup Combo: Aim for 200x

World Cup Combo: Aim for 200xWorld Cup Combo: Aim for 200x

Combine up to 20 World Cup matches in one order

ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য crypto.news@mexc.com এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

K Wave Media ঋণ পরিশোধে অবশিষ্ট BTC বিক্রি করে বিটকয়েন ট্রেজারি কৌশল থেকে বেরিয়ে এল

K Wave Media ঋণ পরিশোধে অবশিষ্ট BTC বিক্রি করে বিটকয়েন ট্রেজারি কৌশল থেকে বেরিয়ে এল

K Wave Media, নাসডাক-তালিকাভুক্ত দক্ষিণ কোরিয়ার মিডিয়া ও বিনোদন কোম্পানি, তার অবশিষ্ট Bitcoin বিক্রি করে দেওয়ার পর আনুষ্ঠানিকভাবে তার Bitcoin ট্রেজারি কৌশলের সমাপ্তি ঘটিয়েছে
শেয়ার করুন
Hokanews2026/07/02 22:20
জাপানের মেটাপ্ল্যানেট $২২১ মিলিয়নের পর বিটকয়েন হোল্ডিং ৪৩,০০০ BTC-এ প্রসারিত করেছে

জাপানের মেটাপ্ল্যানেট $২২১ মিলিয়নের পর বিটকয়েন হোল্ডিং ৪৩,০০০ BTC-এ প্রসারিত করেছে

জাপানি বিনিয়োগ প্রতিষ্ঠান Metaplanet একটি বড় অধিগ্রহণ সম্পন্ন করার পর Bitcoin-এর বৃহত্তম কর্পোরেট ধারকদের মধ্যে একটি হিসেবে তার অবস্থান আরও শক্তিশালী করেছে wo
শেয়ার করুন
Hokanews2026/07/02 21:59
৫০% থেকে ১০০% ওয়ার্ল্ড কাপ বোনাস: BlockDAG বড় পদক্ষেপ নিচ্ছে, Monero-র দাম ধীরে চলছে এবং Solana পুনরুদ্ধারের দিকে তাকিয়ে

৫০% থেকে ১০০% ওয়ার্ল্ড কাপ বোনাস: BlockDAG বড় পদক্ষেপ নিচ্ছে, Monero-র দাম ধীরে চলছে এবং Solana পুনরুদ্ধারের দিকে তাকিয়ে

সর্বশেষ Monero মূল্যের প্রবণতা এবং Solana মূল্যের পূর্বাভাস অন্বেষণ করুন। এছাড়াও, দেখুন কেন অনেকে BlockDAG-কে পরবর্তী বিস্ফোরণকারী ক্রিপ্টো বলছেন এর বিশাল ১০০% বোনাস এবং $500M সহ
শেয়ার করুন
Blockchainreporter2026/07/02 19:00