Разработка программного обеспечения для автоматизированного формирования «Раздела 1. Пояснительная записка» проектной документации в формате XML.

Задание закрыто
Стоимость:Договорная
Срок выполнения:60 дней
Варианты оплаты:Планируется использовать Безопасную сделку
Дата публикации:2025-10-20 22:39
Обновлено:2025-10-20 22:40
Был(а) на сайте:2026-05-26 09:39

Разработка программного обеспечения для автоматизированного формирования «Раздела 1. Пояснительная записка» проектной документации в формате XML.

 
Задача

2. Описание проекта

Проект предполагает создание программного продукта (далее – Система), предназначенного для автоматизации процесса подготовки первого раздела проектной документации – «Пояснительная записка».

Основной сценарий работы Системы:

Пользователь загружает в Систему комплект документов в формате .PDF
(например, общую пояснительную записку, сканы ИРД и т.д.).

Система автоматически анализирует содержимое документов, извлекает необходимые данные (реквизиты, показатели, текстовые блоки) в соответствии со структурой целевой XML-схемы.

Извлечённые данные представляются пользователю в наглядном виде для проверки и согласования.

После подтверждения пользователем Система формирует итоговый XML-файл, полностью соответствующий требованиям актуальной XML-схемы (explanatorynote-01-05.xsd или более новой версии).

Внедрение Системы позволит радикально сократить ручной труд, стандартизировать процесс и минимизировать ошибки при формировании электронной проектной документации.

3. Цели и за...

Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Alexandr Alexandrov
Основная специализация: Веб-разработка и IT
    Приветствую. Проект серьёзный и технически чётко очерчен — фактически это интеллектуальный конструктор пояснительной записки, который объединяет OCR, парсинг PDF и генерацию валидного XML под гос-схему. Сделаю архитектуру с модульным ядром: загрузка, извлечение, ручная валидация и экспорт с проверкой по XSD. В приоритете точность распознавания, стабильность и понятная логика редактирования.

    На связи в Telegram - @Alexuys

    Примеры моих работ

    Календарь на swift
    web app
    site
    Добрый вечер, Данила Усов!

    Заинтересовался вашим проектом по автоматизации формирования пояснительных записок в XML. Имею успешный опыт разработки систем парсинга PDF-документов и работы с XML-схемами, в том числе создавал решения для извлечения структурированных данных из проектной документации.

    Ваша задача технически выполнима, и я вижу несколько эффективных подходов к её реализации. Особенно важным считаю обеспечение точности извлечения данных и удобного интерфейса для проверки результатов.

    Предлагаю обсудить детали реализации, уточнить требования к обработке различных типов PDF-документов и согласовать этапы разработки. Буду рад поделиться конкретными техническими решениями.

    Для оперативной связи пишите в Telegram https://t.me/therebro или VK https://vk.com/therebro - обсудим архитектуру будущей системы и составим план работ.
    Делал подобное. Из разношёрстных предоставленных организациями автоматически собирал отраслевой справочник единой структуры.
    Здравствуйте! Мы понимаем вашу задачу — требуется разработка системы, которая автоматизирует извлечение данных из PDF-документов для формирования валидного XML-файла в соответствии с XSD-схемой. Проект технически сложный, но вполне реализуемый.

    Что можем предложить:
    — Разработаем систему, способную обрабатывать PDF-документы (в том числе отсканированные), извлекать ключевые реквизиты, числовые показатели и текстовые блоки с высокой точностью (OCR + ML).
    — Реализуем web-интерфейс с визуальным редактором извлечённых данных и гибкой валидацией на этапе подтверждения пользователем.
    — На выходе — строго соответствующий XSD-схеме валидный XML (explanatorynote-01-05.xsd и последующие версии).
    Ключевые преимущества:
    — Опыт автоматизации документооборота и генерации XML
    — Понимание архитектуры типовых XSD-схем и требований ФАУ "Главгосэкспертиза"
    — Упор на точность, UX и минимизацию ручных правок
    — Масштабируемость: можно доработать под другие разделы ПД

    Уточните, пожалуйста:

    1. Есть ли примеры PDF-документов, с которыми должна работать система (скан/текст/смешанный формат)?
    2. XML-схема уже финализирована, или возможны изменения?

    Готовы подключиться к проекту — предложим архитектуру, опишем этапы, создадим демо.Напишите в Telegram: https://t.me/Soboleva_Lab
    Обсудим технические детали, стоимость и подготовим решение!
    Доброго времени суток!
    Готов обсудить Ваш проект.
    Здравствуйте. Реализую систему с компьютерным зрением и формированием xml.
    Разработал ПО для обработки ИТР документации одного из заводов РФ. Также систематизировал возможность подгрузки документов моусош для участия в конкурсах и событиях

    Мой ТГ
    @SERGEiT217
    Данила, приветствую! сделаю систему, которая принимает комплект пдфок, автоматически распознаёт текст и таблицы, извлекает реквизиты и текстовые блоки по заданной схеме, даёт удобный интерфейс для проверки и правки каждого поля вместе с фрагментом исходного пдф, и по подтверждению формирует валидный xml файл. реализую гибкий ocr модуль с предобработкой изображений, модуль парсинга и сопоставления с xsd, подсветку полей с низкой уверенностью, логи ошибок и версий, валидацию xml по схеме и экспорт. систему выкладываю в docker, подключу базу для хранения исходников и версии документов, добавлю апи для интеграции с вашими системами и набор тестов для оценки точности, напишите мне в тг https://t.me/BizAutomation_pro
    Здравствуйте.

    Предлагаю разработать систему для автоматизации подготовки раздела проектной документации, включая функционал для анализа, извлечения и генерации XML-файлов на основе загруженных PDF-документов.

    Описание решения:
    Система позволит пользователю загружать PDF-файлы, после чего будет осуществляться автоматическое извлечение необходимых данных с использованием технологий OCR и парсинга. Извлечённые данные будут структурированы в соответствии с целевой XML-схемой, предоставлены для проверки, редактирования и подтверждения. После согласования пользователем, готовый XML-файл будет сгенерирован и проверен на соответствие актуальным требованиям.

    Основная логика работы:
    - Загрузка документов: реализация интерфейса, позволяющего пользователю загружать один или несколько PDF-файлов с локального диска.
    - Извлечение данных: использование библиотеки PyMuPDF или pdfplumber для извлечения текстов, а также Tesseract OCR для распознавания текстов из изображений.
    - Валидация и отображение данных: разработка пользовательского интерфейса с использованием библиотеки Flask или Django, где будет отображаться извлечённая информация с возможностью редактирования.
    - Генерация XML: реализация генерации XML-файла с использованием библиотеки lxml или xml.etree.ElementTree, а также валидация результата по заданной XML-схеме.

    Техническая реализация: Python, библиотеки Tesseract, PyMuPDF или pdfplumber для обработки PDF, Flask или Django для создания интерфейса, lxml или xml.etree.ElementTree для работы с XML.

    Связь для уточнения деталей: Telegram — @DanilChagarnoy.
    Здравствуйте! Готов обсудить более подробно. Контакты в подписи
    Здравствуйте!

    Я внимательно изучил описание проекта по автоматизации формирования раздела 1 «Пояснительная записка».

    Я понимаю, что требуется создать систему, которая:
    — принимает и анализирует PDF-документы;
    — автоматически извлекает из них структурированные данные (через OCR и парсинг);
    — предоставляет пользователю интерфейс проверки и редактирования;
    — формирует итоговый XML-файл, полностью соответствующий актуальной XSD-схеме (explanatorynote-01-05.xsd или новее).

    Я работаю с Java / Spring Boot, PostgreSQL, знаком с OCR (Tesseract, Google Vision API), PDF-разбором (PDFBox, iText) и XML-валидацией (JAXB, SchemaFactory).

    Готов реализовать MVP-версию (загрузка PDF -> OCR -> извлечение данных -> валидация -> XML)
    в течение 3–4 недель.

    ? Ориентировочная стоимость — от 150 000 до 200 000 ? за полный рабочий прототип
    (включая OCR, парсинг, валидацию и XML-генерацию).

    После подписания NDA готов уточнить сроки и финальную смету под полное ТЗ.

    ? Для связи: Telegram — @runwwway

    Буду рад обсудить детали и приступить к работе
    17:11 21.10.25
    Здравствуйте!

    Я внимательно изучил описание проекта по автоматизации формирования раздела 1 «Пояснительная записка».

    Я понимаю, что требуется создать систему, которая:
    — принимает и анализирует PDF-документы;
    — автоматически извлекает из них структурированные данные (через OCR и парсинг);
    — предоставляет пользователю интерфейс проверки и редактирования;
    — формирует итоговый XML-файл, полностью соответствующий актуальной XSD-схеме (explanatorynote-01-05.xsd или новее).

    Я работаю с Java / Spring Boot, PostgreSQL, знаком с OCR (Tesseract, Google Vision API), PDF-разбором (PDFBox, iText) и XML-валидацией (JAXB, SchemaFactory).

    Готов реализовать MVP-версию (загрузка PDF -> OCR -> извлечение данных -> валидация -> XML)
    в течение 3–4 недель.

    ? Ориентировочная стоимость — от 150 000 до 200 000 ? за полный рабочий прототип
    (включая OCR, парсинг, валидацию и XML-генерацию).

    После подписания NDA готов уточнить сроки и финальную смету под полное ТЗ.

    ? Для связи: Telegram — @runwwway

    Буду рад обсудить детали и приступить к работе
    Здравствуйте!
    Меня зовут Андрей Мартынов, я представляю группу разработчиков – NC-1.
    Более пяти лет мы создаем веб-сайты, мобильные приложения, интернет-магазины, ERP/CRM системы и другие e-commerce продукты. Над вашим проектом будет работать команда наших специалистов:
    1. Project Manager
    Стек: Jira/Confluence, Agile/Scrum, коммуникация с заказчиком
    Задачи: управление проектом, сроки, требования, приемка этапов
    2. Backend Developer (Python)
    Стек: Python, FastAPI, PyMuPDF, Tesseract, lxml, PostgreSQL
    Задачи: обработка PDF, OCR, извлечение данных, генерация XML
    3. Frontend Developer
    Стек: React + TypeScript, Material-UI, PDF.js, XML редактор
    Задачи: интерфейс валидации, просмотр PDF, формы редактирования
    4. ML/Data Engineer
    Стек: Python, OpenCV, spaCy, дообучение OCR моделей
    Задачи: повышение точности распознавания, извлечение таблиц
    5. DevOps Engineer
    Стек: Docker, AWS/GCP, CI/CD, мониторинг
    Задачи: развертывание, настройка OCR сервисов, производительность
    Кейсы https://1drv.ms/b/c/b7a0d31a9dae1bc5/EeH6JPdpBbpKtrkA1zFQOIMBF4gS47GaZUsAfO3xcL3HKQ?e=e3Lryi
    Портфолио - https://ncomsoft.ru/
    Мой телеграм - @Ncomsoft1
    С уважением, Андрей М.

    Примеры моих работ

    B2B-система управления производством и продажами "FIORINO"
    Геймифицированное мобильное приложение для корпоративного обучения " PES ONLINE"
    ПРИЛОЖЕНИЕ "UBER ДЛЯ УСЛУГ"
    добрый вечер!

    Уточните, пожалуйста:

    1. Есть ли примеры PDF-документов, с которыми должна работать система (скан/текст/смешанный формат)?
    2. XML-схема уже финализирована, или возможны изменения?

    Нужны пример XSD и PDF файлов.

    Стоимость пока от балды - нужны доп данные

    Пишите в тг@GordeevVitaly
    Ваше решение это человеческий документо оборот
    На базе предположем ELMA 365 или другой CRM системы
    В ней все есть много готовых решений и не стоит изобретать велосипед.
    Есть как онлайн версии так и Офлайн.
    Приветствую, Данила! Я менеджер компании AV Studio https://avdeevstudio.ru/?utm_source=frelanc

    Мы разрабатываем программное обеспечение для автоматизации бизнес-процессов. Реализуем систему для автоматизированного формирования отчетов с удобным интерфейсом, гибкими настройками и надежной архитектурой. Обеспечим стабильность, производительность и точное выполнение поставленных задач.

    Присылайте ссылку на задание
    Давайте обсудим детали в Телеграм: https://t.me/Avdeev_Vasiliy
    Фулл стек, готов взяться. 1500 час или объем

    Портфолио:

    Самописы:
    jobs-publisher.store
    jobs-publisher.ru
    pechat3dpechat.store
    master-academy.ru
    delivery-man.store
    rosdorgroup.ru
    master-academy.store
    tandemarketing.store

    По приложениям:
    https://docs.google.com/document/d/1gzNOUaneYNXzBy9UuvOoyU0WU713wV_Q/edit?usp=sharing&ouid=116722294822589687319&rtpof=true&sd=true

    Работы:
    https://drive.google.com/file/d/1Qg4P1hoPKKccQyoJet7A7DcYgElze73o/view?usp=drive_link. – система управления компанией
    написана с нуля, по срокам заняла 3 месяца phyton

    https://drive.google.com/file/d/1px7bUSt2rLxmfkXoFHALWZuyg1s_oUm7/view?usp=sharing – браузерная онлайн игра, реализовано под фулл phyton+mongo
    1. app 2. MongoDB 3. app game (WebScokets)
    1. Игра (python FastAPI – websockets)
    2. API python FastAPI – Админка + сохранение истории + настройка логики игры
    3. Frontend часть – Vue.js
    4. MongoDb чат и уведомлений

    Последние работы:
    leutin-ing.ru  – проект на  WordPress
    ezway.pro – проект на  WordPress
    fcpa.work– проект на  WordPress
    dia-sg.com – проект на  WordPress
    jobspublisher.com –  Html  + php
    remote-jobs.pro – Html  + php
    housepro.info – парсинг обьектов недвижимости Wordpress + кастомка
    sellmyhouse.club – Html  + php
    ngs-smart.kz/- разработка на джанго
    donjewellery.ru
    mag-e.store/

    https://t.me/dani_marketing
    Добрый день!
    Готов реализовать этот проект, поскольку имею большой опыт в разработке на Python.
    С уважением, Владимир
    Здравствуйте, готов взяться за вашего бота создам его быстро, максимум может дней 7

    Оставлять заявки могут только авторизованные пользователи.

    Другие открытые задания:

    поиск заданий