NVIDIA به تازگی سیستمهای جدید GB300 NVL72 خود را منتشر کرد. آنها میتوانند 50 برابر بیشتر کار را در هر مگاوات برق نسبت به پلتفرم قدیمیتر Hopper انجام دهند. این بدان معناست که هزینهها برای هر قطعه اطلاعات پردازش شده 35 برابر کاهش مییابد.
Signal65 تست جداگانهای روی GB200 NVL72 انجام داد و دریافت که بیش از 10 برابر اطلاعات بیشتری را در هر وات پردازش میکند و هزینهها را به یک دهم آنچه بود کاهش میدهد.
بهبودها همچنان ادامه دارد. ارتقاهای کتابخانه TensorRT-LLM شرکت NVIDIA به تنهایی به GB200 افزایش عملکرد پنج برابری را در فقط چهار ماه برای وظایفی که نیاز به پاسخهای فوری دارند، داد. تیمهایی که روی ابزارهای Dynamo، Mooncake و SGLang کار میکنند، کارایی را حتی بالاتر میبرند.
این ابزارهای مبتنی بر هوش مصنوعی در صورتی که تأخیر زمانی وجود داشته باشد یا نتوانند زمینه کافی را به خاطر بسپارند، خراب میشوند. شرکتها نیاز دارند که آنها در موقعیتهای تجاری واقعی کار کنند، نه فقط نسخههای نمایشی.
ابزارهای هوش مصنوعی که کد مینویسند و به عنوان دستیاران دیجیتال کار میکنند، اکنون نزدیک به نیمی از همه جستجوهای مرتبط با هوش مصنوعی را تشکیل میدهند، که از فقط 11٪ یک سال پیش افزایش یافته است.
این اعداد از گزارش State of Inference شرکت OpenRouter میآید و نشان میدهد که چیزها در این فضا چقدر سریع در حال تغییر هستند.
این جهش ناگهانی شرکتها را وادار کرده است تا سختافزارهایی بسازند که بتوانند همگام شوند. این دستیاران مبتنی بر هوش مصنوعی نیاز دارند فوراً پاسخ دهند و زمینه را از کل پروژههای نرمافزاری به خاطر بسپارند، که تقاضاهای جدی بر قدرت محاسباتی وارد میکند.
انفجار بازار نبرد غولهای فناوری را برای تسلط تقویت میکند
پول درگیر بسیار زیاد است. بازار AI Agent در سال 2024 ارزش 4.92 میلیارد دلار داشت. برآوردها آن را برای سال 2025 در 6.016 میلیارد دلار قرار میدهند، سپس تا سال 2035 به 44.97 میلیارد دلار افزایش مییابد. این رشد 22.28٪ در هر سال برای دهه آینده است. بانکها، بیمارستانها، فروشگاهها و کارخانهها پذیرندگان اولیه هستند.
کسبوکارها این ایجنتها را در سیستمهای مدیریت مشتری، ابزارهای برنامهریزی و تنظیمات امنیتی قرار میدهند تا پول پسانداز کنند و کارهای بیشتری انجام دهند. آنچه به عنوان فناوری اختیاری شروع شد، در حال تبدیل شدن به زیرساخت پایه است.
همانطور که توسط Cryptopolitan گزارش شد، علیبابا به تازگی Qwen3.5 را هدفگذاری بازار چین راهاندازی کرد و ادعا کرد هزینههای پردازش 60٪ کمتر از قبل است. این مدل میتواند به صفحهنمایش نگاه کند و وظایف را در تلفنها و رایانهها انجام دهد. این با اپلیکیشن Doubao شرکت ByteDance رو در رو میشود و یک بهروزرسانی DeepSeek نیز در راه است.
OpenAI در تاریخ 15 Peter Steinberger را استخدام کرد. او OpenClaw، یک AI Agent منبع باز ساخت. مدیرعامل Sam Altman گفت Steinberger کار روی ایجنتهای شخصی نسل بعدی را رهبری خواهد کرد و او را یک نابغه با ایدههای عالی در مورد دستیارهای هوشمند که میتوانند کارهای مفیدی انجام دهند، نامید.
بحران استعداد که هیچ کس نمیتواند حل کند
94٪ از رهبران کسبوکار میگویند که کمبود مهارتهای هوش مصنوعی دارند. تا سال 2028، 44٪ انتظار دارند همچنان 20 تا 40٪ کمبود داشته باشند. Workera میگوید این شکافها میتوانند در سال 2026 از محصولات تأخیر یافته، مسائل کیفیت و از دست دادن فروش، 5.5 تریلیون دلار به اقتصاد جهانی هزینه کنند.
در حال حاضر تقاضا برای استعدادهای هوش مصنوعی در سراسر جهان 3.2 به یک از عرضه پیشی میگیرد. مشاغل هوش مصنوعی 67٪ بیشتر از موقعیتهای نرمافزاری معمولی دستمزد میپردازند. با این حال 85٪ از کارگران اداری در مورد این چیزها در وقت خود یاد میگیرند و 83٪ میگویند که بیشتر خودشان به خود آموزش میدهند به جای اینکه آموزش رسمی دریافت کنند.
وقتی شرکتها ابزارهای هوش مصنوعی را از فروشندگان تخصصی خریداری میکنند، 67٪ از مواقع موفق میشوند. ساختهای داخلی فقط حدود یک سوم به همان اندازه کار میکنند.
Salesforce در اوایل سال 2025 رشد 119٪ ایجنت را دید و از 500 میلیون دلار درآمد تکراری برای این محصولات عبور کرد. آنها در سه ماه 6,000 مشتری سازمانی اضافه کردند.
کسبوکارها احتمالاً راهحلها را خریداری میکنند به جای اینکه آنها را بسازند. این نشان میدهد که بازار در اطراف چند بازیگر بزرگ که میتوانند آنچه را که واقعاً کار میکند تحویل دهند، متمرکز میشود.
منبع: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


