From 026c69e06138e8e80cf42ad96074d531bb7a01ec Mon Sep 17 00:00:00 2001 From: dttb Date: Mon, 22 Jun 2026 00:24:45 +0300 Subject: [PATCH] =?UTF-8?q?German:=20api=5Fmax=5Fretries=206=E2=86=921=20+?= =?UTF-8?q?=20fallback=20cx/gpt-5.5=20=D0=BF=D0=B5=D1=80=D0=B2=D1=8B=D0=BC?= =?UTF-8?q?=20(=D1=84=D0=B8=D0=BA=D1=81=209-=D0=BC=D0=B8=D0=BD=20=D0=B7?= =?UTF-8?q?=D0=B0=D0=B2=D0=B8=D1=81=D0=B0=D0=BD=D0=B8=D0=B9=20=D0=BF=D1=80?= =?UTF-8?q?=D0=B8=20=D0=BA=D0=B0=D0=BF=D0=B5=20Max);=20OmniRoute=203.8.29?= =?UTF-8?q?=20+=20=D1=87=D0=B8=D1=81=D1=82=D0=BA=D0=B0=20db=5Fbackups?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- claude-memory/omniroute.md | 2 ++ decisions/2026-06-18-german-hermes-agent-deploy.md | 2 +- 2 files changed, 3 insertions(+), 1 deletion(-) diff --git a/claude-memory/omniroute.md b/claude-memory/omniroute.md index 286f37d..ece2e07 100644 --- a/claude-memory/omniroute.md +++ b/claude-memory/omniroute.md @@ -6,6 +6,8 @@ originSessionId: 9f26284f-db92-456f-813d-fd8210b7d7b6 --- ## OmniRoute v3.6.5 (LXC 132, 10.0.0.179) +> ⚠️ **2026-06-21 статус (обновлено).** OmniRoute обновлён **3.8.16 → 3.8.29** (`cd /root/.npm/_npx/cb5891f90ae65d14 && npm install omniroute@latest` + `systemctl restart omniroute`); почищены `db_backups` (6.1G/20 файлов → 939M/3 — копят ~300МБ/запись, забивают диск → 500-ошибки, чистить периодически). **Корневая боль:** весь Max (`cc/*`) флапает `400 "out of extra usage"` — общую Max-квоту делят openclaw+swarmclaw+code-server(Claude Code)+German+коробка Александра; маленькие запросы проходят, большие (агент+тулы) падают. `kr/*` (Kiro) непригоден (`402 "reached the limit"`). **Единственный независимый от Max рабочий путь = `cx/gpt-5.5` (Codex).** Живо: `cc/claude-opus-4-8/4-7`, `cc/sonnet-4-6` (Max, флапают), `cx/gpt-5.5`. Мертво: `kr/*`, `cx/gpt-5.4`, `gemini-cli/*` (403), `gh/*` (500). Решение капов: Max overflow billing ИЛИ убрать часть агентов с `cc/*`. + - **Путь**: /root/OmniRoute/, Node.js 22, Next.js 16.2, git repo (github.com/diegosouzapw/OmniRoute) - **Dashboard**: http://10.0.0.179:20128, пароль: 1qaz!QAZ - **API**: http://10.0.0.179:20128/v1 diff --git a/decisions/2026-06-18-german-hermes-agent-deploy.md b/decisions/2026-06-18-german-hermes-agent-deploy.md index dd8d131..e0632e4 100644 --- a/decisions/2026-06-18-german-hermes-agent-deploy.md +++ b/decisions/2026-06-18-german-hermes-agent-deploy.md @@ -15,7 +15,7 @@ tags: [decision, ai, hermes, telegram, lxc, assistant] ## Модель - Провайдер **OmniRoute** (OpenAI-совместимый шлюз на LXC 132): `base_url http://10.0.0.179:20128/v1`. -- **Активная модель: `cc/claude-opus-4-8`** (Opus 4.8 via Max). **Fallback-цепочка (исправлена 2026-06-19): `cc/claude-sonnet-4-6` → `cx/gpt-5.5`.** Fallback в Hermes **срабатывает на 400 «out of extra usage»** (проверено по логам cc→fallback) — поэтому рабочий fallback критичен. ⚠️ Прежний fallback `kr/claude-sonnet-4.5` сдох: **OmniRoute потерял креды провайдера Kiro** («No credentials for provider: kiro», 2026-06-19) → German падал ПОЛНОСТЬЮ (и primary капнут, и fallback мёртв). `cx/gpt-5.5` выбран финальным fallback потому, что Codex — **отдельный провайдер, не Max** → переживает полный кап Max-квоты. Проверено: cx/gpt-5.5 работает через агентский цикл с тулами+KB. +- **Активная модель: `cc/claude-opus-4-8`** (Opus 4.8 via Max). **Fallback-цепочка (2026-06-21): `cx/gpt-5.5` → `cc/claude-sonnet-4-6`; `api_max_retries: 1`.** (Было `api_max_retries: 6` + fallback `cc/sonnet-4-6` первым → German отвечал по **533с/9мин**: 6 ретраев с бэкоффом на каждой капнутой Max-модели. Фикс: 1 попытка + независимый `cx/gpt-5.5` первым → failover за секунды. Ответ 13с после фикса.) Fallback в Hermes **срабатывает на 400 «out of extra usage»** (проверено по логам cc→fallback) — поэтому рабочий fallback критичен. ⚠️ Прежний fallback `kr/claude-sonnet-4.5` сдох: **OmniRoute потерял креды провайдера Kiro** («No credentials for provider: kiro», 2026-06-19) → German падал ПОЛНОСТЬЮ (и primary капнут, и fallback мёртв). `cx/gpt-5.5` выбран финальным fallback потому, что Codex — **отдельный провайдер, не Max** → переживает полный кап Max-квоты. Проверено: cx/gpt-5.5 работает через агентский цикл с тулами+KB. - **КОРЕНЬ 400 «out of extra usage» (исправленное понимание):** это НЕ персистентное исчерпание квоты. Олег верно заметил: «если бы лимиты — ты (Claude на Opus 4.8) тоже бы не работал». Проверка по факту 2026-06-18 ~22:30: `curl cc/claude-opus-4-8` к OmniRoute с system-prompt 14B / 2КБ / 8КБ → **все 200**. То есть 400 в 19:11/19:18 был **транзиентным** — краткий кап 5-часового окна Max в момент пиковой нагрузки (Max делят this-session/German/openclaw/swarmclaw/code-server). Окно отпускает само. Если 400 участятся — включить overflow (pay-as-you-go) на claude.ai/settings/usage. - ⚠️ **`cc/claude-opus-4-8` (Max) ФЛАПАЕТ** `400: You're out of extra usage`: прямой curl к OmniRoute то проходит (19:16), то нет — реальные запросы Олега падали (19:11 «Привет», 19:18 «Бенелюкс», разные request_id). Причина: включённая Max-квота Opus в текущем окне исчерпана (overflow/pay-as-you-go выключен), а окно делят **openclaw (cc/opus-4-7) + swarmclaw (cc/opus-4-8) + code-server** через тот же OmniRoute `cc/*`. - **400 — non-retryable BadRequestError → fallback НЕ срабатывает** (Hermes уводит в fallback только на rate-limit/5xx/connection). Поэтому fallback на Sonnet от Opus-400 не спасает.