Нужен был способ проверять рыночные гипотезы и выводить мобильные приложения в Google Play / App Store в 50+ раз быстрее традиционной разработки. Классический цикл "идея → публикация" занимает 3–6 месяцев и десятки тысяч долларов. Цель — сократить до 3 суток и себестоимости менее $5 за приложение, сохранив enterprise-качество кода и автоматическую проверку соответствия магазинам.
Спроектировал и реализовал архитектуру из 11 автономных микросервисов на Python/FastAPI/asyncio + PostgreSQL + Redis Streams. Каждый ключевой этап (генерация идеи, продуктовая критика, market research, feature review, спецификация, кодогенерация, ревью, compliance, публикация, аналитика) — отдельный агент со своим LLM.
Ключевая инновация — "совет директоров из AI": на критичных этапах 4 независимые модели (OpenAI o4-mini, Claude Opus 4.6 с extended thinking, Google Gemini 2.5 Pro с thinking, DeepSeek Reasoner) параллельно оценивают решение и голосуют. Консенсус ≥3/4 — пропуск дальше, иначе пайплайн уходит на доработку с фидбеком от каждой модели.
Кодогенерация — не однократный вызов LLM, а многоуровневая оркестрация: PlannerAgent строит DAG задач, PlanReviewPanel из 4 моделей голосует за план, TaskExecutorAgent генерирует файлы параллельно в топологическом порядке, TaskReviewerAgent ревьюит каждый файл с retry до 3 раз.
Стек: Python/FastAPI, asyncio, PostgreSQL, Redis Streams, SQLAlchemy 2.x, Pydantic v2, Docker, Claude CLI subprocess, OpenAI/Anthropic/Google/DeepSeek API.
— Цикл "идея → публикация в магазинах" сокращён с 6 месяцев до 72 часов (×60 ускорение).
— Себестоимость одного приложения — от $3 (включая LLM-вызовы и инфраструктуру).
— 553 автотеста, 0 падающих. 27/27 качественных проверок пройдено на 100/100 в собственном судье-фреймворке.
— Система реально выводит приложения в Google Play / App Store / RuStore.
— Один специалист управляет конвейером, заменяющим команду из 8–12 разработчиков.