UC-010 · Statement · cockburn-wiegers

Когда использовать Opus, а когда хватит Sonnet?

Алмаз Салимзянов21 мая 2026 г.2 мин чтения
Актор: РазработчикУровень: Пользовательская цель

По умолчанию — повседневная (Sonnet). Топовая — только если видишь системные ошибки рассуждения.

Описание

Разработчик различает «топовые» модели (Opus, GPT-5 высоких рангов) и «повседневные» (Sonnet, обычные GPT-5, GLM, DeepSeek и т. п.). По умолчанию — повседневная модель; переключение на топовую — только при явной необходимости.

Предусловия

  • Подключено несколько моделей (через прямой провайдер или через универсальный харнесс типа OpenCode)
  • Есть представление о текущей стоимости подписок и токенов

Постусловия / гарантия успеха

  • Задача решена с разумным соотношением «качество/стоимость»
  • Накопленные наблюдения о моделях зафиксированы (например, в AGENTS.md команды, UC-003 · AGENTS.md)

Основной сценарий

  1. Разработчик стартует задачу на повседневной модели (например, Sonnet)
  2. Оценивает качество рассуждения по thinking-выводу
  3. Если ответы достаточны — продолжает на той же модели
  4. Если видны системные ошибки рассуждения — переключается на топовую модель и сравнивает результат

Расширения / альтернативные потоки

  • 2a. Для экспериментов с новой моделью — отдельный pay-as-you-go аккаунт (например, OpenCode Zen) на небольшую сумму
  • 3a. Локальные модели рассматриваются как enterprise/edge-сценарий, а не как ежедневный инструмент

Исключения и риски

Бизнес-правила и ограничения

  • Не платить отдельно за «новую» модель только потому, что она новая: проверять, есть ли реальное улучшение под ваш профиль задач
  • Новые версии часто потребляют в 2–3 раза больше токенов при том же качестве — учитывать в TCO

Примечания

Современные топовые модели сошлись по качеству до уровня, когда выбор между ними определяется в основном привычной экосистемой и стоимостью, а не «прорывом» в возможностях.

Частые вопросы

В чём принципиальная разница между Sonnet и Opus?+
Sonnet — рабочая лошадка: быстрая, дешёвая, достаточная для 80-90% задач разработки. Opus — глубокое рассуждение, лучше держит длинный план, дороже в 3-5 раз. На простой задаче разница не видна.
Можно ли использовать GPT-5 через Claude Code?+
Не напрямую: подписка одного провайдера через сторонний агент часто запрещена ToS. Связка делается через ACP-протоколы (например, GitHub Copilot).
Почему API-расход внезапно стал 300 USD/мес?+
Прямой доступ по API без подписки — это no-rate-limit. Длинная сессия с MCP-серверами (UC-007) ест 100k+ токенов на одно сообщение. Реальные кейсы — 300+ USD на одного разработчика в месяц. Решение: подписка или агрессивная гигиена контекста (UC-002).
Стоит ли переходить на новую версию модели сразу после релиза?+
Не обязательно. Новые версии часто потребляют в 2-3 раза больше токенов при том же качестве — TCO растёт быстрее, чем польза. Подождите 2-4 недели, посмотрите бенчмарки и отзывы коллег по вашему стеку.
Локальные модели — это реальный вариант?+
Для enterprise/edge — да. Для ежедневной разработки — пока нет: качество и скорость уступают облачным топам в разы. Рассматривать как часть периметра безопасности (UC-012), а не как замену.

Связанные выпуски

Поделиться выпуском
← свайп для смены ↑