Рабочие встречи в Росатоме идут 1–2 часа, с несколькими спикерами, зашумлённой записью и смесью тематик в одном разговоре. Секретарь вручную слушает запись, вытаскивает поручения, ответственных и сроки — это 30–60 минут на час встречи, плюс постоянный риск пропустить договорённость или исказить формулировку.
Нужна система, которая из транскрипта достаёт структурированный вывод: кто что поручил, кому, к какому сроку, какие решения приняты, с цитатами из исходника для верификации.
Построил NLP-пайплайн:
1. Транскрибация (Whisper + diarization) → текст с таймкодами и ролями спикеров.
2. Сегментация на смысловые блоки — LLM режет длинный разговор на тематические куски.
3. Извлечение сущностей через structured output от Claude: задачи, исполнители, сроки, решения.
4. Валидация: перекрёстная проверка — действительно ли в контексте участник согласился, упомянут ли срок явно.
5. Формирование выхода: таблица задач + саммари встречи, каждая запись со ссылкой-цитатой на исходный фрагмент.
Стек: Python, OpenAI API, Whisper, Postgres.
— Время обработки часовой встречи: ~60 минут ручной работы секретаря → 3–5 минут автоматической.
— Внедрено в регулярный рабочий процесс подразделения.
— Сценарий тиражируется на соседние команды.