Нужен персональный AI-ассистент прямо в мессенджере: чтобы отвечал в Telegram, искал в вебе, дотягивался до своих заметок и сам выполнял проверки по расписанию. Готовые SaaS-боты это вроде закрывают, но ценой контроля: переписки и данные уходят в чужое облако, оплата идёт за каждого пользователя, кастомизация — в пределах того, что разрешил вендор, а при отключении сервиса всё уезжает вместе с ним.
Сразу разведём два понятия, потому что их часто путают: речь про self-hosted агента, а не self-hosted модель. Модель (Claude Haiku/Sonnet/Opus и резервные) работает по API и стоит ровно столько, сколько стоит токен. На своём сервере живёт сам агент — оркестрация, маршрутизация, память, интеграции, конфиг. Дешевле AI от этого не становится, токены те же. Выигрыш в другом: платформа, данные и настройки принадлежат владельцу, без платформенной подписки и привязки к поставщику.
Цель — развернуть под ключ персональную агентную систему на сервере клиента и сопровождать её, чтобы владелец просто общался с агентом в мессенджере, а контроль над данными и кастомизация оставались у него.
Разворвернул под ключ агентную систему на базе OpenClaw — open-source gateway, который принимает сообщения из мессенджеров и маршрутизирует их к LLM. Софт бесплатный и открытый, сервер и данные — клиента. Весь стек на мне: инфраструктура, безопасность, агенты, интеграции, сопровождение.
Платформа и деплой. Gateway на VPS поднимается через Docker Compose (gateway + cli) или нативно, с автозапуском под systemd. Перед ним — Caddy как reverse proxy с автоматическим TLS. Конфигурация в строгом JSON; большинство правок подхватываются на лету, бэкапы конфига создаются автоматически.
Агенты и модели. Несколько агентов под разные задачи с маршрутизацией по каналам и пользователям (bindings): отдельные Telegram-боты заводятся как разные accountId со своими токенами и привязываются к своему агенту. У каждого агента своя модель и fallback-цепочка: основной провайдер Anthropic (Haiku на лёгкое, Sonnet/Opus на сложное), при сбое автоматически подхватывают резервные провайдеры (DeepSeek, Qwen, GLM). Дешёвая модель идёт на рутину, премиум — на сложный анализ.
Каналы. Основной — Telegram с мультиагентным роутингом и политикой доступа (pairing / allowlist). Архитектура расширяема на WhatsApp, Discord, Slack без переписывания ядра.
Интеграции и поиск. Веб-поиск через Perplexity. Доступ к данным владельца — через MCP: заметки в Obsidian, внешние сервисы через mcporter bridge, разбор multi-account. Так агент отвечает по данным клиента, а не из головы модели.
Автоматизация. Heartbeat будит агента по интервалу для батча проверок (с активными часами), Cron запускает задачи по точному расписанию; агент умеет сам ставить себе cron-задачи.
Память. Долгосрочная память на SQLite + кураторский MEMORY.md — контекст переживает рестарты сервера.
Сабагенты. Тяжёлые подзадачи уходят в изолированные сессии на дешёвой модели (оркестратор → воркеры), без раздувания основного контекста.
Безопасность и сопровождение. Hardening Ubuntu (UFW, SSH-ключи, fail2ban). Секреты держу в отдельном .env через SecretRef. Доступ к админке gateway закрыт: bind на loopback + SSH-туннель или Caddy/TLS; для нулевых открытых портов — апгрейд на Tailscale/WireGuard. Скилы ставлю с аудитом по репутации (после атак на публичный реестр скилов это критично) и изоляцией в контейнере. Плюс crash-recovery через systemd, бэкапы конфигов, контроль затрат и rate-limit, обновления. Это управляемое сопровождение, а не «поставил и забыл».
Работающая персональная агентная система на сервере владельца: он общается с агентом(ами) в Telegram, а данные, конфиг и интеграции остаются на его VPS. Развёрнуто и работает: мультиагентный роутинг, fallback между провайдерами, MCP multi-account, веб-поиск, автоматизация по heartbeat и cron, память, переживающая рестарты. Дашборд инстанса показывает аптайм и состояние каналов/агентов/скилов — система живёт автономно.
Кастомизация под владельца: свои агенты, свои модели и маршрутизация, свои интеграции и скилы — то, что в чужом SaaS закрыто настройками вендора.
Рыночный ориентир (2026): сам OpenClaw open-source и бесплатен, managed-хостинги под него берут $29–39/мес за инстанс как платформенную плату; self-host обходится в $5–15/мес за VPS плюс 4–10 часов первичного сетапа и 1–3 часа в месяц на поддержку. Это и закрывает услуга «под ключ + сопровождение». Честно: токены моделей оплачиваются по API в обоих случаях одинаково, дешевле AI не становится. Платишь за другое — контроль над данными, кастомизацию и отсутствие платформенной подписки и vendor lock-in.