Антошка стережёт Алекса: мониторинг + лечение + алерт пилота

- antoshka-watch-alex.sh на LXC 137, cron */3
- проверяет контейнер/gateway/omniroute/диск, лечит restart/pct start
- алерт Олегу от имени Антошки, дедуп; боевой тест пройден

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
dttb
2026-05-31 22:30:01 +03:00
parent 2d1821f585
commit 83a73e0d3a
2 changed files with 339 additions and 0 deletions

View File

@@ -134,6 +134,16 @@ status: active
- On-demand в TG: «нас не ломают?» → Алекс сам зовёт проверку, объясняет спокойно. Проверено.
- Статус: всё чисто, ~150 WAN-SSH брутов отбито (nft counter растёт — защита держит вектор).
## Антошка стережёт Алекса — внешний мониторинг пилота (2026-05-31)
Антошка (openclaw LXC 137, 10.0.0.239 / NetBird 100.70.167.54, бот-токен `8020760639:AAH-Ra0nayJnFgjvSVAagAtZgSb46onBpB4`) следит за коробкой Алекса, лечит и алертит Олега. Второй слой поверх `Restart=on-failure` самих сервисов.
- **Скрипт:** `/root/antoshka-watch-alex.sh` на LXC 137, cron `*/3`.
- **Путь лечения:** LXC 137 → `sshpass -p 1qaz!QAZ ssh root@10.0.0.147` (pve-147) → `pct exec 102` (137 умеет sshpass, достаёт pve-147 и 10.0.0.163).
- **Проверяет:** контейнер 102 `running` (иначе `pct start 102`); `openclaw-gateway` active (иначе restart); `omniroute` active + HTTP `:20128` отвечает (иначе restart); диск <90% (иначе только алерт, сам не чистит). Перепроверка через 6с — не ловить штатный рестарт.
- **Алерт** от имени Антошки Олегу (chat `1292155421`), дедуп md5 + «отбой». Проверено боевым тестом: `stop openclaw-gateway` → Антошка поймал, перезапустил (`active`), прислал алерт.
- ⚠️ **При передаче клиенту:** Алекс автономен (самолечение `Restart=on-failure`); Антошка достанет коробку уже только через NetBird (`100.70.186.192`) — поправить IP в скрипте на NetBird-адрес или оставить как опц. внешний контроль Олега.
## NPM (reverse proxy)
| Параметр | Значение |