Клиент — динамично развивающаяся компания с огромным объемом внутренней накопленной информации (регламенты, технические инструкции, прайс-листы, юридические документы и история переписки с клиентами). Сотрудники тратили до 30% рабочего времени на поиск нужной информации в разрозненных файлах. Попытки использовать стандартные LLM (вроде ChatGPT) приводили к «галлюцинациям»: нейросеть выдумывала условия договоров или технические характеристики, что недопустимо в бизнесе.
Создать единую «цифровую память» компании — бота-ассистента, который мгновенно отвечает на вопросы сотрудников и клиентов, основываясь исключительно на официальных документах компании, с точностью ответов близкой к 100%.
Для реализации проекта я выбрал стек технологий, обеспечивающий максимальную точность и безопасность данных:
Инфраструктура: Развернул систему на Self-hosted n8n через Docker. Это позволило клиенту полностью контролировать поток данных и не платить за дорогостоящие подписки на облачные сервисы автоматизации.
Архитектура базы данных: В качестве «мозга» системы я использовал Supabase (Vector DB).
Технология Hybrid Search: Чтобы полностью исключить галлюцинации, я внедрил гибридный поиск. Система одновременно использует:
Векторный поиск (поиск по смыслу и контексту).
Полнотекстовый поиск (BM25) (поиск по точным терминам, артикулам и ключевым словам). Это гарантирует, что ИИ найдет нужный абзац даже в документе на 1000+ страниц.
Обработка данных (ETL-процесс): Настроил в n8n автоматический парсинг файлов (PDF, Docx, Excel). Система разбивает текст на смысловые фрагменты (chunks) и обновляет базу знаний в реальном времени при добавлении новых документов.
Интерфейс: Интегрировал ассистента в рабочие каналы компании — Telegram и WhatsApp.
Создана закрытая интеллектуальная система, которая стала «правой рукой» для отделов продаж и поддержки.
Точность и надежность: Благодаря Hybrid Search система достигла 99% точности в ответах. Если информации нет в документах, бот честно отвечает «В базе знаний нет данных по этому вопросу», вместо того чтобы выдумывать ответ.
Скорость: Время получения ответа по сложным регламентам сократилось с 15–20 минут до 3–5 секунд.
Безопасность: Все внутренние документы компании хранятся в защищенном контуре заказчика. Данные не используются для обучения публичных моделей OpenRouter/OpenAI.
Экономическая выгода: Автоматизация поиска и первичных консультаций позволила компании не нанимать двух дополнительных сотрудников в отдел поддержки, что окупило разработку системы уже через 3 месяца.
Практическое применение: Сейчас бот используется менеджерами по продажам для быстрой сверки условий по сложным контрактам и технической поддержкой для ответов на узкоспециализированные запросы клиентов. Система масштабируема: при добавлении новых отделов достаточно просто загрузить их папку с документами в систему.