Какую модель Claude выбрать: Sonnet vs Opus и когда переключаться

По умолчанию — повседневная (Sonnet). Топовая — только если видишь системные ошибки рассуждения.

Описание

Разработчик различает «топовые» модели (Opus, GPT-5 высоких рангов) и «повседневные» (Sonnet, обычные GPT-5, GLM, DeepSeek и т. п.). По умолчанию — повседневная модель; переключение на топовую — только при явной необходимости.

Предусловия

Подключено несколько моделей (через прямой провайдер или через универсальный харнесс типа OpenCode)
Есть представление о текущей стоимости подписок и токенов

Постусловия / гарантия успеха

Задача решена с разумным соотношением «качество/стоимость»
Накопленные наблюдения о моделях зафиксированы (например, в AGENTS.md команды, UC-003 · AGENTS.md)

Основной сценарий

Разработчик стартует задачу на повседневной модели (например, Sonnet)
Оценивает качество рассуждения по thinking-выводу
Если ответы достаточны — продолжает на той же модели
Если видны системные ошибки рассуждения — переключается на топовую модель и сравнивает результат

Расширения / альтернативные потоки

2a. Для экспериментов с новой моделью — отдельный pay-as-you-go аккаунт (например, OpenCode Zen) на небольшую сумму
3a. Локальные модели рассматриваются как enterprise/edge-сценарий, а не как ежедневный инструмент

Исключения и риски

Бизнес-правила и ограничения

Не платить отдельно за «новую» модель только потому, что она новая: проверять, есть ли реальное улучшение под ваш профиль задач
Новые версии часто потребляют в 2–3 раза больше токенов при том же качестве — учитывать в TCO

Примечания

Современные топовые модели сошлись по качеству до уровня, когда выбор между ними определяется в основном привычной экосистемой и стоимостью, а не «прорывом» в возможностях.

Частые вопросы

В чём принципиальная разница между Sonnet и Opus?+

Sonnet — рабочая лошадка: быстрая, дешёвая, достаточная для 80-90% задач разработки. Opus — глубокое рассуждение, лучше держит длинный план, дороже в 3-5 раз. На простой задаче разница не видна.

Можно ли использовать GPT-5 через Claude Code?+

Не напрямую: подписка одного провайдера через сторонний агент часто запрещена ToS. Связка делается через ACP-протоколы (например, GitHub Copilot).

Почему API-расход внезапно стал 300 USD/мес?+

Прямой доступ по API без подписки — это no-rate-limit. Длинная сессия с MCP-серверами (UC-007) ест 100k+ токенов на одно сообщение. Реальные кейсы — 300+ USD на одного разработчика в месяц. Решение: подписка или агрессивная гигиена контекста (UC-002).

Стоит ли переходить на новую версию модели сразу после релиза?+

Не обязательно. Новые версии часто потребляют в 2-3 раза больше токенов при том же качестве — TCO растёт быстрее, чем польза. Подождите 2-4 недели, посмотрите бенчмарки и отзывы коллег по вашему стеку.

Локальные модели — это реальный вариант?+

Для enterprise/edge — да. Для ежедневной разработки — пока нет: качество и скорость уступают облачным топам в разы. Рассматривать как часть периметра безопасности (UC-012), а не как замену.

Когда использовать Opus, а когда хватит Sonnet?