Сколько стоит Claude Code в 2026 — реальные цифры за месяц, ccusage и формула «API vs Max»
Сколько стоит Claude Code в 2026 — реальные цифры за месяц, ccusage и формула «API vs Max»
Anthropic в марте 2026 впервые раскрыл агрегированную статистику: средний разработчик тратит на Claude Code $6 в день. 90% пользователей укладываются в $12/день. Но средние числа мало что говорят, когда один разработчик тратит $2 на десяток правок, а другой жжёт $60 в день на агентские команды.
TL;DR: Реальный месячный счёт за Claude Code — от $50 до $1200+ в зависимости от интенсивности. Max за $100 бьёт API уже при 50+ сессиях в месяц. Pro хватает на 2-3 часа интенсивной работы, Max 5x — на полный день, Max 20x — практически без ограничений.
npx ccusage@latest monthlyпокажет ваш реальный расход за 10 секунд.
Где посмотреть, сколько ты тратишь
Прежде чем считать чужие деньги — посмотри свои.
Для API-пользователей — команда /cost прямо в сессии:
Total cost: $0.55 Total duration (API): 6m 19.7s Total duration (wall): 6h 33m 10.2s
Для подписчиков Pro/Max — /cost не показывает реальных денег (подписка фиксированная), но /stats показывает паттерны использования.
Для всех — ccusage, CLI-инструмент, который парсит локальные JSONL-логи Claude Code и считает токены/деньги по каждой модели:
npx ccusage@latest monthly # сводка за месяц npx ccusage@latest daily --breakdown # разбивка по моделям за день npx ccusage@latest session # стоимость каждой сессии
ccusage работает локально, без API-ключей — просто читает логи из ~/.claude/. Показывает cache creation, cache read и реальную стоимость с учётом кешированных токенов.
Реальные счета: три профиля разработчиков
По данным документации Anthropic и отчётам из сообщества:
- Лёгкое использование (1-2 сессии/день, точечные правки) — $2-5/день → $50-100/мес на API. Pro за $20 покрывает с запасом
- Среднее (3-5 часов/день, мульти-файловые задачи на Sonnet) — $6-12/день → $130-260/мес на API. Max 5x за $100 экономит в 1.5-2.5 раза
- Тяжёлое (мульти-агентные воркфлоу, автоматизация, полный день) — $20-60+/день → $400-1200+/мес на API. Max 20x за $200 — единственный разумный вариант
Один разработчик поделился данными: за 8 месяцев ежедневной работы — 10 миллиардов токенов. По API это стоило бы $15 000. На Max за $100/мес он заплатил $800. Экономия 93%.
На сколько хватает каждого плана
Anthropic не публикует точные лимиты в штуках запросов — они зависят от размера кодовой базы, длины контекста и модели. Но по независимым тестам и данным сообщества картина складывается так:
Pro ($20/мес) — хватает на 2-3 часа интенсивной работы:
- ~10-45 промптов за 5-часовое окно (зависит от сложности запросов)
- В тестах лимит наступает примерно на 40-45 сообщениях
- 40-80 Sonnet-часов в неделю
- Opus не доступен — только Sonnet 4.6
- При интенсивной работе лимит прерывает процесс 2-3 раза за день
- Если распределить по дню — до 200 сообщений за 24 часа, но это уже не интенсивный кодинг, а точечные вопросы
Max 5x ($100/мес) — хватает на полный рабочий день:
- ~50-225 промптов за 5-часовое окно
- В тестах — ~200 сообщений до лимита
- 140-280 Sonnet-часов / 15-35 Opus-часов в неделю
- Доступен Opus 4.6 для сложных архитектурных задач
- Один пользователь с автономным агентом (ralph loop) на HN: лимит сессии сбрасывался 4-5 раз в день, недельный лимит исчерпывался за 3 дня. ccusage показывал ~$750/неделю API-эквивалент — то есть за $100 он получал услуг на $3000/мес
Max 20x ($200/мес) — практически без потолка:
- ~200-900 промптов за 5-часовое окно
- В тестах — ~900 сообщений, ощущался как безлимитный
- 240-480 Sonnet-часов / 24-40 Opus-часов в неделю
- Один пользователь на HN: ccusage показывал ~$600/день API-эквивалент — за $200/мес он получал услуг на $18 000
Важный нюанс: лимиты работают как три независимых ограничения — 5-часовое окно, недельный cap и RPM в минуту. Можно исчерпать RPM, не тронув дневную квоту, или сжечь 5-часовое окно к обеду, не приблизившись к недельному лимиту. Интерфейс не показывает, какой именно лимит сработал — отсюда ощущение «ограничили без причины».
Ещё один подвох: лимиты общие для всех поверхностей. Claude Code, claude.ai, Claude Desktop, Cowork — всё из одного пула. Если утром выжали контекст в Claude Code, вечером в claude.ai будет меньше.
Цены за токены — шпаргалка
По официальной странице Anthropic, актуально на март 2026:
- Opus 4.6 — $5 / $25 за миллион токенов (вход/выход)
- Sonnet 4.6 — $3 / $15 за миллион токенов
- Haiku 4.5 — $1 / $5 за миллион токенов
Кешированные токены (cache hit) стоят 10% от входной цены. То есть для Sonnet: $0.30 вместо $3 за миллион. Это ключевая механика экономии — и Claude Code использует её автоматически.
Кеш — ваш главный союзник в экономии
Claude Code автоматически кеширует контекст (системные промпты, содержимое файлов, историю разговора). Кеш живёт 5 минут после последнего сообщения.
Реальные замеры показывают: в типичной сессии 84% входных токенов попадают в кеш. Это даёт ~74% экономии на входных токенах. Без кеша средний запрос обходится в ~$0.23, с кешем — ~$0.06.
Практический вывод: не делай длинных пауз между запросами. Если перерыв больше 5 минут — кеш сбрасывается и следующий запрос будет дорогим. /compact лучше всего вызывать сразу, пока кеш ещё тёплый — суммаризация получит скидку на кешированные токены.
Запись в кеш стоит 1.25x от базовой цены (25% наценка). Но она окупается уже после одного последующего запроса — потому что каждый cache read стоит всего 0.1x.
Формула: когда API дешевле Max
Простая математика:
Max 5x ($100/мес) выгоднее API, когда ваш API-счёт превышает $100/мес. По данным Anthropic, это порог в ~50 сессий/месяц при среднем использовании.
Max 20x ($200/мес) выгоднее, когда API-счёт превышает $200/мес. Если работаете с Claude Code 4+ часа в день — это ваш план.
Pro ($20/мес) выгоднее API, когда тратите больше $20/мес. По сути, если вы используете Claude Code хотя бы час в день, Pro уже экономит деньги.
API выгоднее подписки только когда: вы используете Claude Code эпизодически — меньше 50 сессий в месяц, или строите автоматизацию, где нужен программный контроль (свои ключи, workspace лимиты, billing API).
Чтобы узнать свой точный порог — запустите npx ccusage@latest monthly и посмотрите на колонку "Cost".
Скрытые множители стоимости
Есть три вещи, которые взрывают расход незаметно:
1. Agent teams — 7x от обычной сессии. Каждый teammate запускает собственный контекст. Команда из 3 агентов потребляет примерно в 7 раз больше токенов, чем одиночная сессия. Экспериментальная фича (CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1), но если включили — следите за /cost.
2. Fast mode на Opus — 6x от стандартных цен. $30/$150 за миллион токенов вместо $5/$25. Включается отдельно и стакается с кешированием. Один длинный запрос на fast mode Opus может стоить как целый день на Sonnet.
3. Extended thinking — тихий пожиратель. Thinking tokens считаются как выходные токены. Бюджет по умолчанию — десятки тысяч токенов на запрос. Для простых задач это оверкилл. Снижайте через /effort или MAX_THINKING_TOKENS=8000.
Подводные камни
Лимиты Max сжираются быстрее, чем ожидаешь. С 23 марта 2026 пользователи сообщают, что 5-часовое окно на Max-плане исчерпывается за 1-2 часа вместо обычных 5. Один Max 20x пользователь увидел как метр прыгнул с 52% до 91% на одном промпте.
ccusage считает по прайс-листу, а не по реальному биллингу. Если вы на Max — ccusage покажет «сколько бы стоило на API», а не реальный расход. Полезно для понимания экономии, но не для бухгалтерии.
/compact может потерять важный контекст. Суммаризация сжимает историю, и иногда выбрасывает решения, принятые в начале сессии. /compact Focus on architectural decisions and code changes помогает сохранить критические моменты — но не гарантирует.
Большие репозитории сжигают лимит быстрее. При загрузке крупного репо в контекст каждый промпт весит значительно больше — и 45 запросов Pro превращаются в 15-20. Это «эффект исчезающего лимита»: чем больше рабочий набор файлов, тем быстрее горит квота.
Вердикт
Из всех способов управления стоимостью, самый большой эффект дают два: правильный выбор плана (Max vs API — разница до 93%) и prompt caching (74% экономии автоматически, но теряется при паузах > 5 минут). Всё остальное — /clear, .claudeignore, переключение моделей — оптимизация на 10-20%, которая имеет смысл при расходе выше $300/мес.
Если Pro прерывает работу больше двух раз в неделю — Max 5x за $100 окупается не деньгами, а нервами. Для большинства разработчиков это sweet spot: лимитов хватает на полный рабочий день, доступен Opus, а API-эквивалент стоил бы $130-260.
Как попробовать
- Замерьте текущий расход:
npx ccusage@latest monthly— увидите реальные цифры за последний месяц - Включите отображение токенов в статусбаре:
/config→ Status line → включите context window usage — видно сколько контекста сожрано в реальном времени - Попробуйте
/costпосле каждой крупной задачи — привыкнете чувствовать, сколько стоят разные типы запросов - Сравните с порогом $100/мес — если ccusage показывает больше, Max 5x уже окупается
- Настройте
.claudeignore— добавьтеnode_modules/,dist/,*.lock,vendor/— документация Claude Code рекомендует это как первый шаг