По умолчанию — повседневная (Sonnet). Топовая — только если видишь системные ошибки рассуждения.
Описание
Разработчик различает «топовые» модели (Opus, GPT-5 высоких рангов) и «повседневные» (Sonnet, обычные GPT-5, GLM, DeepSeek и т. п.). По умолчанию — повседневная модель; переключение на топовую — только при явной необходимости.
Предусловия
- Подключено несколько моделей (через прямой провайдер или через универсальный харнесс типа OpenCode)
- Есть представление о текущей стоимости подписок и токенов
Постусловия / гарантия успеха
- Задача решена с разумным соотношением «качество/стоимость»
- Накопленные наблюдения о моделях зафиксированы (например, в AGENTS.md команды, UC-003 · AGENTS.md)
Основной сценарий
- Разработчик стартует задачу на повседневной модели (например, Sonnet)
- Оценивает качество рассуждения по thinking-выводу
- Если ответы достаточны — продолжает на той же модели
- Если видны системные ошибки рассуждения — переключается на топовую модель и сравнивает результат
Расширения / альтернативные потоки
- 2a. Для экспериментов с новой моделью — отдельный pay-as-you-go аккаунт (например, OpenCode Zen) на небольшую сумму
- 3a. Локальные модели рассматриваются как enterprise/edge-сценарий, а не как ежедневный инструмент
Исключения и риски
Бизнес-правила и ограничения
- Не платить отдельно за «новую» модель только потому, что она новая: проверять, есть ли реальное улучшение под ваш профиль задач
- Новые версии часто потребляют в 2–3 раза больше токенов при том же качестве — учитывать в TCO
Примечания
Современные топовые модели сошлись по качеству до уровня, когда выбор между ними определяется в основном привычной экосистемой и стоимостью, а не «прорывом» в возможностях.
Частые вопросы
В чём принципиальная разница между Sonnet и Opus?+
Sonnet — рабочая лошадка: быстрая, дешёвая, достаточная для 80-90% задач разработки. Opus — глубокое рассуждение, лучше держит длинный план, дороже в 3-5 раз. На простой задаче разница не видна.
Можно ли использовать GPT-5 через Claude Code?+
Не напрямую: подписка одного провайдера через сторонний агент часто запрещена ToS. Связка делается через ACP-протоколы (например, GitHub Copilot).
Почему API-расход внезапно стал 300 USD/мес?+
Прямой доступ по API без подписки — это no-rate-limit. Длинная сессия с MCP-серверами (UC-007) ест 100k+ токенов на одно сообщение. Реальные кейсы — 300+ USD на одного разработчика в месяц. Решение: подписка или агрессивная гигиена контекста (UC-002).
Стоит ли переходить на новую версию модели сразу после релиза?+
Не обязательно. Новые версии часто потребляют в 2-3 раза больше токенов при том же качестве — TCO растёт быстрее, чем польза. Подождите 2-4 недели, посмотрите бенчмарки и отзывы коллег по вашему стеку.
Локальные модели — это реальный вариант?+
Для enterprise/edge — да. Для ежедневной разработки — пока нет: качество и скорость уступают облачным топам в разы. Рассматривать как часть периметра безопасности (UC-012), а не как замену.