German: api_max_retries 6→1 + fallback cx/gpt-5.5 первым (фикс 9-мин зависаний при капе Max); OmniRoute 3.8.29 + чистка db_backups

This commit is contained in:
dttb
2026-06-22 00:24:45 +03:00
parent 4e0d14a20f
commit 026c69e061
2 changed files with 3 additions and 1 deletions

View File

@@ -6,6 +6,8 @@ originSessionId: 9f26284f-db92-456f-813d-fd8210b7d7b6
---
## OmniRoute v3.6.5 (LXC 132, 10.0.0.179)
> ⚠️ **2026-06-21 статус (обновлено).** OmniRoute обновлён **3.8.16 → 3.8.29** (`cd /root/.npm/_npx/cb5891f90ae65d14 && npm install omniroute@latest` + `systemctl restart omniroute`); почищены `db_backups` (6.1G/20 файлов → 939M/3 — копят ~300МБ/запись, забивают диск → 500-ошибки, чистить периодически). **Корневая боль:** весь Max (`cc/*`) флапает `400 "out of extra usage"` — общую Max-квоту делят openclaw+swarmclaw+code-server(Claude Code)+German+коробка Александра; маленькие запросы проходят, большие (агент+тулы) падают. `kr/*` (Kiro) непригоден (`402 "reached the limit"`). **Единственный независимый от Max рабочий путь = `cx/gpt-5.5` (Codex).** Живо: `cc/claude-opus-4-8/4-7`, `cc/sonnet-4-6` (Max, флапают), `cx/gpt-5.5`. Мертво: `kr/*`, `cx/gpt-5.4`, `gemini-cli/*` (403), `gh/*` (500). Решение капов: Max overflow billing ИЛИ убрать часть агентов с `cc/*`.
- **Путь**: /root/OmniRoute/, Node.js 22, Next.js 16.2, git repo (github.com/diegosouzapw/OmniRoute)
- **Dashboard**: http://10.0.0.179:20128, пароль: 1qaz!QAZ
- **API**: http://10.0.0.179:20128/v1

View File

@@ -15,7 +15,7 @@ tags: [decision, ai, hermes, telegram, lxc, assistant]
## Модель
- Провайдер **OmniRoute** (OpenAI-совместимый шлюз на LXC 132): `base_url http://10.0.0.179:20128/v1`.
- **Активная модель: `cc/claude-opus-4-8`** (Opus 4.8 via Max). **Fallback-цепочка (исправлена 2026-06-19): `cc/claude-sonnet-4-6` → `cx/gpt-5.5`.** Fallback в Hermes **срабатывает на 400 «out of extra usage»** (проверено по логам cc→fallback) — поэтому рабочий fallback критичен. ⚠️ Прежний fallback `kr/claude-sonnet-4.5` сдох: **OmniRoute потерял креды провайдера Kiro** («No credentials for provider: kiro», 2026-06-19) → German падал ПОЛНОСТЬЮ (и primary капнут, и fallback мёртв). `cx/gpt-5.5` выбран финальным fallback потому, что Codex — **отдельный провайдер, не Max** → переживает полный кап Max-квоты. Проверено: cx/gpt-5.5 работает через агентский цикл с тулами+KB.
- **Активная модель: `cc/claude-opus-4-8`** (Opus 4.8 via Max). **Fallback-цепочка (2026-06-21): `cx/gpt-5.5` → `cc/claude-sonnet-4-6`; `api_max_retries: 1`.** (Было `api_max_retries: 6` + fallback `cc/sonnet-4-6` первым → German отвечал по **533с/9мин**: 6 ретраев с бэкоффом на каждой капнутой Max-модели. Фикс: 1 попытка + независимый `cx/gpt-5.5` первым → failover за секунды. Ответ 13с после фикса.) Fallback в Hermes **срабатывает на 400 «out of extra usage»** (проверено по логам cc→fallback) — поэтому рабочий fallback критичен. ⚠️ Прежний fallback `kr/claude-sonnet-4.5` сдох: **OmniRoute потерял креды провайдера Kiro** («No credentials for provider: kiro», 2026-06-19) → German падал ПОЛНОСТЬЮ (и primary капнут, и fallback мёртв). `cx/gpt-5.5` выбран финальным fallback потому, что Codex — **отдельный провайдер, не Max** → переживает полный кап Max-квоты. Проверено: cx/gpt-5.5 работает через агентский цикл с тулами+KB.
- **КОРЕНЬ 400 «out of extra usage» (исправленное понимание):** это НЕ персистентное исчерпание квоты. Олег верно заметил: «если бы лимиты — ты (Claude на Opus 4.8) тоже бы не работал». Проверка по факту 2026-06-18 ~22:30: `curl cc/claude-opus-4-8` к OmniRoute с system-prompt 14B / 2КБ / 8КБ → **все 200**. То есть 400 в 19:11/19:18 был **транзиентным** — краткий кап 5-часового окна Max в момент пиковой нагрузки (Max делят this-session/German/openclaw/swarmclaw/code-server). Окно отпускает само. Если 400 участятся — включить overflow (pay-as-you-go) на claude.ai/settings/usage.
- ⚠️ **`cc/claude-opus-4-8` (Max) ФЛАПАЕТ** `400: You're out of extra usage`: прямой curl к OmniRoute то проходит (19:16), то нет — реальные запросы Олега падали (19:11 «Привет», 19:18 «Бенелюкс», разные request_id). Причина: включённая Max-квота Opus в текущем окне исчерпана (overflow/pay-as-you-go выключен), а окно делят **openclaw (cc/opus-4-7) + swarmclaw (cc/opus-4-8) + code-server** через тот же OmniRoute `cc/*`.
- **400 — non-retryable BadRequestError → fallback НЕ срабатывает** (Hermes уводит в fallback только на rate-limit/5xx/connection). Поэтому fallback на Sonnet от Opus-400 не спасает.