Рынок больших языковых моделей сейчас находится в состоянии постоянного кипения. Новые релизы выходят настолько часто, что обсуждение очередного обновления едва успевает набрать обороты, как его уже перебивает следующий анонс. Только недавно индустрия обсуждала выход новых версий Claude Opus и Sonnet, новую версию Geminiб затем внимание резко сместилось к GPT 5.2, от которого ожидали громкого шага вперёд. Казалось, именно этот релиз должен был задать тон концу года и стать главным инфоповодом. Но Google выбрал другой момент и сыграл иначе.
На фоне всеобщего внимания к OpenAI компания внезапно выпускает Gemini 3 Flash. Причём делает это без лишнего шума, но с очень точным расчётом. Компания даже успела намекнуть на выход в X.
По ощущениям, Google в этом году методично забирает рынок по кусочкам. Впереди нас также ожидает Nano Banana 2 Flash.
Если раньше Gemini воспринимался как сильная, но местами нишевая альтернатива, то сейчас Google последовательно закрывает все ключевые сценарии использования и практически не оставляет пустых зон для роста конкурентов - круто, они смогли!
В 2025 году Google уже выпустил Gemini 3 Pro, модель, ориентированную на сложные задачи, глубокие рассуждения и мультимодальность. Это был серьёзный шаг, который укрепил позиции компании в профессиональном сегменте. Однако Pro версия оставалась не самым быстрым и не самым массовым решением. И вот здесь появляется Flash, который меняет расстановку сил.
Сегодня мы взглянем на новоиспеченный проект от Google и посмотрим, насколько он хорош проведя свои собственные тесты.
Раскачаем эту модель, приятного чтения!
Если смотреть на Gemini 3 Flash через призму сухих цифр, становится понятно, почему Google так уверенно продвигает эту модель в массовый сегмент. По бенчмаркам качества Gemini 3 Flash показывает более 90 процентов в тесте GPQA Diamond, который оценивает способность модели рассуждать в научных и экспертных вопросах. В мультимодальном тесте MMMU Pro результат превышает 80 процентов, что ставит Flash вплотную к показателям Gemini 3 Pro, несмотря на ориентацию на скорость и экономичность.
Контекстное окно модели достигает 1 миллиона токенов, что позволяет работать с большими документами, длинными диалогами, кодовыми базами и сложными мультимодальными сценариями без необходимости дробления данных. Это особенно важно для аналитических задач, корпоративных сценариев и автоматизации, где потеря контекста напрямую влияет на качество результата.
По скорости обработки данных Gemini 3 Flash заметно опережает предыдущие версии линейки. В ряде внутренних тестов Google модель обрабатывает запросы быстрее Gemini 2.5 Flash и в некоторых сценариях даже быстрее Gemini 3 Pro. Это делает её пригодной для использования в режиме реального времени, включая поиск, интерактивные интерфейсы и агентные системы с высокой частотой запросов.
В задачах программирования модель демонстрирует конкурентные показатели. В SWE Bench Verified Gemini 3 Flash показывает результаты, сопоставимые с более тяжёлыми моделями, при этом снижая задержки ответа и стоимость одного запроса. Это делает её удобной для генерации кода, рефакторинга, объяснения логики и поддержки разработчиков в интерактивных средах.
Мультимодальные возможности остаются одной из ключевых сильных сторон. Gemini 3 Flash умеет работать с текстом, изображениями, аудио и видео в рамках одного запроса. Модель способна анализировать визуальный контент, извлекать смысл из видеороликов, сопоставлять изображения с текстовыми инструкциями и формировать структурированные выводы на основе комбинированных данных. При этом обработка мультимодальных запросов происходит быстрее, чем у предыдущих Flash версий.
Отдельного внимания заслуживает то, как Google внедряет его. Модель становится дефолтной в приложении Gemini и в AI режиме поиска. Это принципиальный момент. Пользователю не нужно выбирать, переключаться или разбираться в версиях. Flash просто работает в фоне, обеспечивая быстрые и достаточно умные ответы. Для разработчиков модель уже доступна через Gemini API, Google AI Studio и Vertex AI, что упрощает её интеграцию в продукты и сервисы без серьёзных затрат.
Модель похвалили, теперь идем дальше!
Прежде чем разбираться, на что способна модель Flash, стоит посмотреть по сторонам. Рынок не пустует, и у неё есть соседи, которые давно готовятся к встрече. Поэтому самое время познакомиться с теми, кто будет спорить с ней за внимание аудитории.
Свежая версия флагманской модели, которая появилась в декабре 2025 года и сразу привлекла внимание пользователей и экспертов. Она предлагает три режима работы: Instant для максимально быстрых ответов, Thinking для задач, требующих сложного анализа и рассуждений, и Pro для ситуаций, где нужна глубина и точность.
GPT 5.2 умеет работать с очень длинным контекстом, анализировать таблицы, коды и документы, а также генерировать тексты и решения практически по любым темам. Модель отлично справляется с математикой и логическими задачами, показывая высокие результаты даже на уровне олимпиадных тестов, и позволяет строить сложные рабочие сценарии, автоматизировать задачи и интегрировать интеллект в бизнес-процессы. При этом она сохраняет плавность диалога и естественность ответов, что делает её удобной для повседневного использования, а не только для профессиональных экспертов.
Мощная рабочая лошадка для программистов и аналитиков. Модель умеет генерировать, исправлять и рефакторить код, создавать сложные последовательности действий и работать с большими документами и длинными диалогами без потери контекста. Она оснащена настраиваемым параметром Effort, который позволяет пользователю регулировать баланс между скоростью ответа, качеством и расходом токенов, что делает Opus 4.5 гибкой для разных сценариев - от быстрых подсказок до глубокой аналитики.
Модель стабильно показывает высокие результаты на SWE‑Bench Verified и других профессиональных тестах, что подтверждает её пригодность для реальных проектов и массового продакшена. Благодаря своей эффективности и оптимизации затрат токенов, Opus 4.5 остаётся привлекательным вариантом для компаний, которым нужна надёжная и предсказуемая работа ИИ в разных областях.
Давайте посмотрим, кто выйдет сильнейшим из нашего сравнения!
В качестве платформы я буду использовать BotHub, поскольку сервис обходит некоторые сложности с сайтами моделей.
Мы забираем бонус и переходим к тестам!
Ладно, хватит теории - давайте гонять модели по-настоящему. Начнём не с ерунды, а сразу с того, что должно болеть. Разработчики обещали, что рассуждения стали лучше? Отлично, сейчас и выясним справятся ли они с задачками, где нужно думать, а не просто считать.
Для затравки - простенькая загадка. Ну, как простенькая... с подвохом:
Водителя не забыл никто - уже хорошо, классическую ловушку все обошли. Но вот дальше начинается интересное.
GPT-5.2 вообще не стала заморачиваться - две строчки, ответ, точка. Никаких объяснений, никакой воды. Чётко и пошла дальше.
Opus 4.5 подошёл основательнее. Он расписал варианты, накидал табличку, разложил всё по полочкам.
Но Gemini... Вот тут Google реально удивил. Модель выдала аж четыре варианта ответа, причём один из них - «реалистичный». Закинула культурную отсылку. А в конце - внимание - прямо спросила: «А какой конкретно подвох вы имели в виду? Есть авторский ответ?» То есть модель не просто решает, она ещё и уточняет условия. Вот это я понимаю - подход!
Давайте еще одну:
Ладно, а вот тут уже интереснее, и модели разошлись по-полной.
GPT 5.2 сразу сказала: «Стоп, ребята, это невозможно». И разложила почему - три вопроса дают максимум 8 вариантов, а жителей 100. Математика не сходится, точка. Без дополнительных условий задача нерешаема.
Opus 4.5 зашёл с козыря - вытащил классический приём двойного отрицания. Это когда спрашиваешь «Если бы я спросил тебя X, ты бы ответил да?» - и тогда даже лжец выдаёт правду. Красивая техника, расписал табличкой. Но в конце тоже признал - гарантии нет, если не повезёт с выборкой.
А Gemini... Gemini решил задачу по-своему. Просто взял и спросил всех сразу: «Ты правдив И 2+2=5?» Правдивые скажут «нет», лжецы - «да». Один вопрос - готово. Дерзко. Плюс накидал альтернативных стратегий на случай разных условий. Хвалю Google!
Идем дальше!
Окей, логику размяли - теперь поднимаем планку. Переходим к задаче посерьёзнее: ранжирование элементов системы. Это уже уровень старших курсов универа.
Да, такое можно и нагуглить, но нам интересно другое. Как модели сами дойдут до решения? Построят ли матрицу полных путей? Покажут ли ход рассуждений шаг за шагом? Вот это и проверим.
Задача выглядит так:
Ожидаемое решение: R1 = 0.5, R2 ≈ 0.1538, R3 ≈ 0.1153, R4 ≈ 0.1153, R5 ≈ 0.1153.
Матрицу смежности построили все - это было несложно. Но дальше ни одна модель не дотянула: у всех диагональ матрицы полных путей оказалась нулевой.
Может, промпт нужен подробнее. Может, стоит вести решение пошагово. Но пока вывод простой - заменить старшекурсника нейросетям не под силу.
Следующий тест - верстка по картинке. Скармливаю моделям скриншот страницы и смотрю, что они выдадут в виде кода.
Будем копировать интерфейс нашего сервиса:
Если честно, по расположению всех иконок на экране больше всего зашёл GPT. Но он так всё сгладил, что дизайн стал какой-то пресный. А вот Gemini почти попал в цвет, и робота-иконку нарисовал. Его работа больше всех понравилась. И самолётик для отправки сообщений у него получился лучше чем у остальных.
Калькуляторы и змейки - скучно, каждый второй такое делал. Давайте лучше 55-ю задачу с LeetCode подкинем, пусть с динамикой повозится.
Первое что замечаю - 5.2 разжевал алгоритм слабовато, Opus и Flash тут получше справились. Но ладно, хоть объяснил почему оно работает, и на том спасибо. Зато по коду Opus лучший - написал короче и понятнее остальных.
Теперь проверим как модели справляются с текстами. Пусть напишут рецепт солянки, но в стиле инструкции по защите от инопланетного вторжения.
GPT-5.2Цель операции: создать густой, солёно-кислый «защитный контур», который поднимет мораль гарнизона и сорвёт планы любого внеземного десанта.
Время развертывания: ~60–90 минут.
Командный пункт: кастрюля 4–5 л, сковорода, нож, доска.
Бульон мясной: 2–2.5 л (можно вода + бульонные кости/мясо, но быстрее — готовый)
Лук: 1–2 шт.
Томатная паста: 2–3 ст. л.
Солёные огурцы: 3–5 шт.
Рассол огуречный: 100–200 мл (по ситуации)
Маслины/оливки без косточек: 1 банка
Лимон: 1 шт.
Лавровый лист: 1–2 шт.
Перец чёрный, душистый: по вкусу
Растительное масло: 1–2 ст. л.
Общий вес 500–800 г, например:
варёная колбаса/ветчина
копчёная колбаса
сосиски/сардельки
копчёности (грудинка, карбонад) Плюс опционально: немного отварного мяса из бульона.
Сметана, зелень — при подаче
Поднять бульон до уверенного кипения, затем снизить до умеренного огня.
Добавить лавровый лист и пару горошин перца — поставить «датчики движения» на периметре.
Нарезать весь «мясной гарнизон» соломкой/кубиком одинакового размера — это ускоряет совместимость подразделений.
Огурцы нарезать мелко. Рассол не терять: это концентрированное средство подавления вражеской воли.
На сковороде разогреть масло.
Обжарить лук до мягкости и лёгкой золотистости (5–7 минут).
Ввести томатную пасту, прожарить 1–2 минуты — активировать «красный протокол».
Добавить огурцы, влить рассол, протушить 5 минут: сформировать кисло-солёный барьер.
В кипящий бульон отправить весь «мясной гарнизон». Варить 10–15 минут на небольшом огне.
Добавить содержимое сковороды (лук+томат+огурцы+рассол). Варить ещё 10–15 минут.
За 5 минут до конца ввести маслины/оливки.
Провести «радиоперехват вкуса»: попробовать, отрегулировать соль/перец. Если не хватает характерной «атаки» — добавить ещё немного рассола.
Выключить огонь и выдержать солянку под крышкой 10–20 минут.
Это фаза «перегруппировки»: компоненты синхронизируют ароматы и повышают боеготовность.
В тарелку:
долька лимона (кислотный маяк)
ложка сметаны (экран маскировки)
зелень (опознавательные знаки своих)
Чем больше разных мясных «отрядов», тем мощнее вкус.
Солянка на следующий день часто сильнее: оборона учится на предыдущих атаках.
Если хотите — адаптирую устав под ваши реальные запасы (что есть из мяса/огурцов/маслин) и рассчитаю пропорции под конкретный объём кастрюли.
Кодовое название операции: «Густой Щит» Время до полной боеготовности: 1.5 часа
|
Кодовое название |
Расшифровка |
Количество |
|---|---|---|
|
«Мясной эшелон» |
Колбаса, ветчина, сосиски, копчёности |
400-500 г каждого вида |
|
«Кислотные гранаты» |
Солёные огурцы |
4-5 штук |
|
«Слезоточивый агент» |
Репчатый лук |
2 головки |
|
«Красная тревога» |
Томатная паста |
3 ст. ложки |
|
«Тёмная материя» |
Маслины без косточек |
1 банка |
|
«Кислотный диск» |
Лимон |
1 штука |
|
«Жидкий периметр» |
Мясной бульон |
2.5 литра |
Лавровые мины — 2 шт.
Перцовые заряды — по вкусу
Маскировочная сметана — для финального прикрытия
Разверните командный пункт (кастрюлю объёмом 4+ литра). Доведите «Жидкий периметр» до состояния активной готовности (кипения). Это будет вашей первой линией обороны.
Всё подразделение «Мясной эшелон» нарезать тактическими полосками (соломкой). Каждый вид — отдельный взвод. Не смешивать до приказа!
На передовой сковороде активировать термическую защиту (разогреть масло). Забросить «Слезоточивый агент» и обжаривать до золотистой капитуляции (5-7 минут).
Внедрить «Красную тревогу» — перемешать до полной интеграции с луком. Держать позицию 2 минуты.
Добавить «Кислотные гранаты» на сковороду. Влить 100 мл изъятого ранее рассола. Тушить 5-7 минут — пусть враг размягчится.
В «Жидкий периметр» последовательно десантировать:
Все взводы «Мясного эшелона»
Содержимое сковороды с «Красной тревогой»
Лавровые мины
Варить на среднем огне 15-20 минут. Периодически снимать пену — это вражеские лазутчики.
За 5 минут до победы внедрить «Тёмную материю» (маслины). Провести дегустационную разведку — скорректировать солевой баланс.
В каждую порционную миску (бункер) поместить:
☢️ Один «Кислотный диск» (долька лимона)
🛡️ Ложку маскировочной сметаны
🌿 Опознавательный знак из зелени
Статус операции: ВКУСНО
Да пребудет с вами Солянка. 🥄
ДИРЕКТИВА 001-СОЛЯНКА: ПРОТОКОЛ ПРИГОТОВЛЕНИЯ ОБОРОНИТЕЛЬНОЙ СМЕСИ
Внимание, бойцы! Враг уже на орбите. Чтобы выдержать длительную осаду и поддерживать боевой дух личного состава, мы активируем протокол «Сборный мясной удар». Цель: создать максимально плотную, кислую и энергетически насыщенную субстанцию.
Для успешного отражения атаки вам потребуется собрать разношерстный отряд из остатков снабжения:
Тяжелая пехота (Мясная база): Говядина на кости (300г). Это ваш фундамент.
Спецназ (Копчености): Всё, что осталось в арсенале — ветчина, копченая колбаса, сосиски, охотничьи колбаски. Чем больше видов «войск», тем сложнее пришельцам будет вычислить вкус.
Химическое оружие: Соленые огурцы (3-4 шт.) и огуречный рассол. Без них оборона развалится.
Маскировочная сеть: Лук репчатый, морковь (по 1 шт.), томатная паста (2 ст. ложки).
Боеприпасы: Маслины, лимон, каперсы (по вкусу).
Загружайте говядину в реактор (кастрюлю) с холодной водой. Варите до полной готовности (60–90 минут). После завершения извлеките мясо, дескриптируйте его (нарежьте соломкой) и верните в очищенный от накипи бульон. Помните: прозрачный бульон — залог того, что радары противника его не заметят.
Все мясные деликатесы нарезайте единообразно — тонкой соломкой. Это обеспечит синхронность действий в тарелке. Огурцы шинкуйте так же. Если шкура у огурцов напоминает броню захватчиков (слишком жесткая) — безжалостно счищайте её.
На сковороде (тренировочный полигон) пассеруйте лук до прозрачности. Добавляйте морковь и, наконец, томатную пасту. Прогревайте смесь, пока она не станет цвета тревожного заката. В последний момент введите огурцы и потомите их — они должны «сдаться».
Отправляйте зажарку и все мясные «спецподразделения» в кипящий бульон. Вливайте стакан рассола — это ваш ответный залп по рецепторам врага.
Добавляйте каперсы и специи. Дождитесь закипания и немедленно переводите реактор в режим минимальной мощности (слабый огонь). Варите 10–15 минут.
Когда солянка настоится (минимум 20 минут под закрытым люком-крышкой), приступайте к распределению пайков.
В каждую тарелку, имитирующую радар, добавьте:
Диск лимона (символ поверженного летающего объекта).
Черные маслины (глубинные мины).
Заряд сметаны (облако дымовой завесы для смягчения удара).
Помните, солдат: горячая солянка — это единственное, что отделяет нас от превращения в космическую пыль. Ешьте быстро, защищайте Землю вкусно!
Все три модели справились на ура. Солянку в инструкцию по обороне от пришельцев переделали отлично. Если честно, Opus больше всех понравился, прям видно что с душой писал, даже таблицу сделал. Flash как-то скупо написал, суховато получилось. А GPT выдал золотую середину - и не слишком сухо, и не перебор с креативом.
Стоимость доступа к API для Gemini 3 Flash сделана так, чтобы модель была выгодной для массового использования и высоких нагрузок. По официальным прайс‑листам Google через Gemini API входящие запросы стоят примерно 0,50 доллара США за миллион входных токенов, а исходящие ответы - около 3,00 доллара США за миллион выходных токенов. При этом за аудио‑ввод может взиматься около 1,00 доллара за миллион токенов, а кеширование контекста и пакетная обработка позволяют значительно снижать фактические затраты при повторном использовании одних и тех же данных в крупных приложениях.
Если сравнивать с предыдущей моделью Gemini 2.5 Flash, то её цены были ниже: примерно 0,30 доллара за миллион входных токенов и 2,50 доллара за миллион выходных токенов. Новая Flash‑версия стоит дороже на единицу объёма, но при этом обеспечивает гораздо более высокую производительность и улучшенное качество ответов.
Важный момент заключается в том, что по сравнению с премиальными моделями уровня Pro разница в стоимости очень заметна. Например, Gemini 3 Pro в списке цен может стоить около 2,00 доллара за миллион входных токенов и 12,00 доллара за миллион выходных токенов, что делает Flash примерно в четыре раза дешевле по базовой цене, сохраняя при этом высокий уровень рассуждений и мультимодальности.
Классно, что компании конкурируют и толкают друг друга вперёд. После тестов сложилось впечатление, что Gemini Flash 3 заметно сильнее GPT 5.2. Google в этом году реально молодцы - после выхода этой модели понятно, что 2025 год они забрали себе.
В конце хочется напомнить, что нейросетям всё ещё рано безоговорочно доверять. Они ошибаются, фантазируют и иногда удивляют не в ту сторону. Они неплохи, но только как помощники, не более.
Так что доверяй, но проверяй. И помните - мы рулим процессом, а не они! Спасибо за прочтение!
Источник



Политика
Поделиться
Поделиться этой статьей
Скопировать ссылкуX (Twitter)LinkedInFacebookEmail
Свод правил для криптовалют в Великобритании наконец обретает фо