BitcoinWorld
Великое сокращение ИИ: почему более дешёвые модели внезапно стали самой умной ставкой
Индустрия искусственного интеллекта долгое время работала на основе простой, но мощной предпосылки: чем больше модель, тем она лучше, и лучшая модель побеждает. Это предположение подстегнуло гонку за масштабом: такие компании, как OpenAI и Anthropic, вливают миллиарды в обучение всё более крупных передовых моделей. Но сейчас происходит тихий, потенциально сейсмический сдвиг. Растущие затраты вынуждают предприятия пересматривать свою зависимость от самого дорогого ИИ, и начинается новая эра экономически осознанного выбора моделей. Вопрос больше не только о грубой мощи, но и об эффективности, а ответ на него может изменить всю экономику ИИ.
На протяжении многих лет траектория индустрии ИИ определялась «горьким уроком»: использование масштабных вычислений — это самый надёжный путь к повышению производительности. Лаборатории конкурировали по качеству, что означало выбор в пользу самой передовой доступной модели. Инвесторы субсидировали высокие затраты на инференс, давая пользователям мало стимулов для экономии. Теперь эта динамика меняется. Цены на токены растут, субсидии замедляются, и предприятия впервые ощущают реальное ценовое давление. Естественная реакция — начать искать более дешёвые альтернативы.
Сооснователь Coinbase Брайан Армстронг сделал жёсткий прогноз: в течение 12–18 месяцев 80% рабочих нагрузок ИИ будут выполняться на моделях, которые на 99% дешевле сегодняшних передовых систем. Только оставшиеся 20% задач, требующих максимального интеллекта, продолжат использовать модели последнего поколения. Если этот прогноз оправдается, он представляет собой фундаментальное изменение в экономике ИИ. Значительная часть экономии будет получена напрямую из потоков доходов крупных лабораторий, таких как OpenAI и Anthropic, что потенциально нанесёт им серьёзный финансовый удар по мере приближения к IPO.
Первоначальные данные свидетельствуют о том, что прогноз Армстронга не является надуманным. Недавний тест юридического ИИ-инструмента Harvey, проведённый в партнёрстве с платформой инференса Fireworks AI, показал, что затраты можно сократить в три раза без какой-либо потери качества. Система интеллектуально направляла более простые задачи к меньшей и более дешёвой модели (GLM 5.1 от Fireworks), а более мощный Claude Opus резервировался для самой сложной юридической работы. Сооснователь Harvey Гейб Перейра отметил, что определение качества эволюционирует: от простого использования самой мощной модели для всего — к использованию лучшей модели, которая наиболее эффективно даёт правильный ответ.
Разворачивающаяся ценовая война часто преподносится как битва между проприетарными моделями американских лабораторий и моделями с открытыми весами от китайских компаний, таких как DeepSeek. Однако такая формулировка упускает главное. Ключевое разделение — между большими и малыми моделями. Компания может сэкономить, переключившись с передовой модели на более дешёвую альтернативу с открытыми весами, но она может добиться аналогичной экономии, перейдя на меньшую и более дешёвую версию от той же лаборатории. Ценовая война идёт между крупномасштабным и мелкомасштабным инференсом, и для более широкого отраслевого сдвига не имеет значения, какой тип малой модели победит.
Если большинство корпоративных развёртываний можно будет запускать столь же эффективно на меньших и более дешёвых моделях, это серьёзно сдержит растущий спрос на инференс. Это, в свою очередь, поставит сложные вопросы о том, как обосновать огромные затраты на обучение передовой модели. Отрасль находится на распутье. Она может либо принять эффективность и рискнуть замедлить рост своих самых дорогих продуктов, либо найти новые способы продемонстрировать, что дополнительные затраты на передовую модель оправданы. Ответ определит победителей и проигравших в следующей фазе революции ИИ.
Основополагающее предположение индустрии ИИ проходит проверку. По мере того как предприятия сталкиваются с реальным ценовым давлением, переход на меньшие и более дешёвые модели — это уже не теоретическая возможность, а практическая необходимость. Последствия могут быть глубокими: потенциально замедление роста доходов крупных лабораторий и переоценка всей парадигмы масштабирования. Предстоящие месяцы покажут, сможет ли отрасль полюбить более дешёвые ИИ-модели или спрос на передовой интеллект останется ненасытным.
В1: Почему более дешёвые ИИ-модели становятся более привлекательными сейчас?
Рост цен на токены и замедление субсидий со стороны инвесторов создают реальное ценовое давление для предприятий, использующих ИИ. Это вынуждает их искать более эффективные варианты вместо того, чтобы по умолчанию использовать самую мощную модель.
В2: Означает ли использование более дешёвых моделей снижение качества результатов?
Не обязательно. Ранние тесты, например проведённый Harvey, показывают, что при интеллектуальной маршрутизации задач компании могут достичь того же качества, значительно сократив затраты. Ключ в том, чтобы использовать правильную модель для правильной задачи.
В3: Как этот сдвиг повлияет на такие компании, как OpenAI и Anthropic?
Массовый переход на более дешёвые модели может снизить спрос на их самые дорогие услуги инференса, потенциально влияя на их доходы по мере подготовки к публичным размещениям. Это поставит под сомнение их бизнес-модели, построенные на предположении, что клиенты будут платить премию за наилучший возможный интеллект.
Эта публикация «Великое сокращение ИИ: почему более дешёвые модели внезапно стали самой умной ставкой» впервые появилась на BitcoinWorld.


