Разработка и автоматизация: от архитектуры до рабочего продукта

Александр Клепцов icss

Рейтинг: 301
Паспорт верифицирован
Всего отзывов: 0
  • Работ в портфолио: 9
  • Типовых услуг: 0
  • Работ на продажу: 0
  • Возраст: 45 лет
  • Стаж работы: 22 года
  • Зарегистрирован: 12.09.2017
  • Юридический статус:ИП
Был на сайте:

LLM-система с персонализированной долговременной памятью и оценкой ценности контекста

Описание

Разработал LLM-систему с управляемой долговременной памятью для сценариев, где качество ответа должно сохраняться на длинной дистанции. Проект решал типовую проблему больших языковых моделей: ограниченное окно контекста, выпадение важных фактов, накопление повторов и деградация качества при длительном взаимодействии. Требовалось не просто хранить историю, а выстроить архитектуру памяти, которая умеет отбирать, сжимать, ранжировать и повторно использовать действительно ценные знания.

Решение

Спроектировал архитектуру, в которой основная LLM вызывается через внешний API и не хранит состояние между запросами.
Для сохранения долгосрочного контекста реализовал отдельный memory-контур, включающий:

векторное хранилище с метаданными;
хранение value_score, частоты использования, подтвержденности фактов и других признаков значимости;
локальную mini-модель для summarization, кластеризации и сжатия контекста;
controller-слой, который выполняет retrieval по similarity и value_score, собирает compact prompt и обновляет память по итогам взаимодействия.

Система была построена не вокруг “магии промпта”, а вокруг отдельной архитектуры памяти. Это позволило отделить краткосрочный контекст запроса от долговременных знаний, управлять ценностью сохраненной информации, отсекать дубли и снижать шум в промпте. В результате в LLM передавался не сырой массив истории, а компактный и релевантный контекст.

Результат

В результате была создана LLM-система с персонализированной памятью, которая устойчиво работает на длинной дистанции и лучше сохраняет важные факты между сессиями.
Решение позволило:

снизить потерю важного контекста при длительном взаимодействии;
уменьшить количество повторов и дублирующей информации;
повысить релевантность контекста, подаваемого в модель;
сделать память управляемой и ранжируемой по ценности, а не просто накопительной;
создать техническую базу для персонализированных AI-систем, ассистентов и агентных решений с долговременной памятью.

Презентация проекта

0bbf51d0-258a-4776-82eb-64711bc80ec6.png

Оценили проект:

0