Разработка программного обеспечения для автоматизированного формирования «Раздела 1. Пояснительная записка» проектной документации в формате XML.
Задача
2. Описание проекта
Проект предполагает создание программного продукта (далее – Система), предназначенного для автоматизации процесса подготовки первого раздела проектной документации – «Пояснительная записка».
Основной сценарий работы Системы:
Пользователь загружает в Систему комплект документов в формате .PDF
(например, общую пояснительную записку, сканы ИРД и т.д.).
Система автоматически анализирует содержимое документов, извлекает необходимые данные (реквизиты, показатели, текстовые блоки) в соответствии со структурой целевой XML-схемы.
Извлечённые данные представляются пользователю в наглядном виде для проверки и согласования.
После подтверждения пользователем Система формирует итоговый XML-файл, полностью соответствующий требованиям актуальной XML-схемы (explanatorynote-01-05.xsd или более новой версии).
Внедрение Системы позволит радикально сократить ручной труд, стандартизировать процесс и минимизировать ошибки при формировании электронной проектной документации.
3. Цели и за...
Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Приветствую. Проект серьёзный и технически чётко очерчен — фактически это интеллектуальный конструктор пояснительной записки, который объединяет OCR, парсинг PDF и генерацию валидного XML под гос-схему. Сделаю архитектуру с модульным ядром: загрузка, извлечение, ручная валидация и экспорт с проверкой по XSD. В приоритете точность распознавания, стабильность и понятная логика редактирования.
Заинтересовался вашим проектом по автоматизации формирования пояснительных записок в XML. Имею успешный опыт разработки систем парсинга PDF-документов и работы с XML-схемами, в том числе создавал решения для извлечения структурированных данных из проектной документации.
Ваша задача технически выполнима, и я вижу несколько эффективных подходов к её реализации. Особенно важным считаю обеспечение точности извлечения данных и удобного интерфейса для проверки результатов.
Предлагаю обсудить детали реализации, уточнить требования к обработке различных типов PDF-документов и согласовать этапы разработки. Буду рад поделиться конкретными техническими решениями.
Для оперативной связи пишите в Telegram https://t.me/therebro или VK https://vk.com/therebro - обсудим архитектуру будущей системы и составим план работ.
Здравствуйте! Мы понимаем вашу задачу — требуется разработка системы, которая автоматизирует извлечение данных из PDF-документов для формирования валидного XML-файла в соответствии с XSD-схемой. Проект технически сложный, но вполне реализуемый.
Что можем предложить:
— Разработаем систему, способную обрабатывать PDF-документы (в том числе отсканированные), извлекать ключевые реквизиты, числовые показатели и текстовые блоки с высокой точностью (OCR + ML).
— Реализуем web-интерфейс с визуальным редактором извлечённых данных и гибкой валидацией на этапе подтверждения пользователем.
— На выходе — строго соответствующий XSD-схеме валидный XML (explanatorynote-01-05.xsd и последующие версии).
Ключевые преимущества:
— Опыт автоматизации документооборота и генерации XML
— Понимание архитектуры типовых XSD-схем и требований ФАУ "Главгосэкспертиза"
— Упор на точность, UX и минимизацию ручных правок
— Масштабируемость: можно доработать под другие разделы ПД
Уточните, пожалуйста:
1. Есть ли примеры PDF-документов, с которыми должна работать система (скан/текст/смешанный формат)?
2. XML-схема уже финализирована, или возможны изменения?
Готовы подключиться к проекту — предложим архитектуру, опишем этапы, создадим демо.Напишите в Telegram: https://t.me/Soboleva_Lab
Обсудим технические детали, стоимость и подготовим решение!
Разработал ПО для обработки ИТР документации одного из заводов РФ. Также систематизировал возможность подгрузки документов моусош для участия в конкурсах и событиях
Данила, приветствую! сделаю систему, которая принимает комплект пдфок, автоматически распознаёт текст и таблицы, извлекает реквизиты и текстовые блоки по заданной схеме, даёт удобный интерфейс для проверки и правки каждого поля вместе с фрагментом исходного пдф, и по подтверждению формирует валидный xml файл. реализую гибкий ocr модуль с предобработкой изображений, модуль парсинга и сопоставления с xsd, подсветку полей с низкой уверенностью, логи ошибок и версий, валидацию xml по схеме и экспорт. систему выкладываю в docker, подключу базу для хранения исходников и версии документов, добавлю апи для интеграции с вашими системами и набор тестов для оценки точности, напишите мне в тг https://t.me/BizAutomation_pro
Предлагаю разработать систему для автоматизации подготовки раздела проектной документации, включая функционал для анализа, извлечения и генерации XML-файлов на основе загруженных PDF-документов.
Описание решения: Система позволит пользователю загружать PDF-файлы, после чего будет осуществляться автоматическое извлечение необходимых данных с использованием технологий OCR и парсинга. Извлечённые данные будут структурированы в соответствии с целевой XML-схемой, предоставлены для проверки, редактирования и подтверждения. После согласования пользователем, готовый XML-файл будет сгенерирован и проверен на соответствие актуальным требованиям.
Основная логика работы: - Загрузка документов: реализация интерфейса, позволяющего пользователю загружать один или несколько PDF-файлов с локального диска. - Извлечение данных: использование библиотеки PyMuPDF или pdfplumber для извлечения текстов, а также Tesseract OCR для распознавания текстов из изображений. - Валидация и отображение данных: разработка пользовательского интерфейса с использованием библиотеки Flask или Django, где будет отображаться извлечённая информация с возможностью редактирования. - Генерация XML: реализация генерации XML-файла с использованием библиотеки lxml или xml.etree.ElementTree, а также валидация результата по заданной XML-схеме.
Техническая реализация: Python, библиотеки Tesseract, PyMuPDF или pdfplumber для обработки PDF, Flask или Django для создания интерфейса, lxml или xml.etree.ElementTree для работы с XML.
Связь для уточнения деталей: Telegram — @DanilChagarnoy.
Я внимательно изучил описание проекта по автоматизации формирования раздела 1 «Пояснительная записка».
Я понимаю, что требуется создать систему, которая:
— принимает и анализирует PDF-документы;
— автоматически извлекает из них структурированные данные (через OCR и парсинг);
— предоставляет пользователю интерфейс проверки и редактирования;
— формирует итоговый XML-файл, полностью соответствующий актуальной XSD-схеме (explanatorynote-01-05.xsd или новее).
Я работаю с Java / Spring Boot, PostgreSQL, знаком с OCR (Tesseract, Google Vision API), PDF-разбором (PDFBox, iText) и XML-валидацией (JAXB, SchemaFactory).
Готов реализовать MVP-версию (загрузка PDF -> OCR -> извлечение данных -> валидация -> XML)
в течение 3–4 недель.
? Ориентировочная стоимость — от 150 000 до 200 000 ? за полный рабочий прототип
(включая OCR, парсинг, валидацию и XML-генерацию).
После подписания NDA готов уточнить сроки и финальную смету под полное ТЗ.
? Для связи: Telegram — @runwwway
Буду рад обсудить детали и приступить к работе
17:11 21.10.25
Здравствуйте!
Я внимательно изучил описание проекта по автоматизации формирования раздела 1 «Пояснительная записка».
Я понимаю, что требуется создать систему, которая:
— принимает и анализирует PDF-документы;
— автоматически извлекает из них структурированные данные (через OCR и парсинг);
— предоставляет пользователю интерфейс проверки и редактирования;
— формирует итоговый XML-файл, полностью соответствующий актуальной XSD-схеме (explanatorynote-01-05.xsd или новее).
Я работаю с Java / Spring Boot, PostgreSQL, знаком с OCR (Tesseract, Google Vision API), PDF-разбором (PDFBox, iText) и XML-валидацией (JAXB, SchemaFactory).
Готов реализовать MVP-версию (загрузка PDF -> OCR -> извлечение данных -> валидация -> XML)
в течение 3–4 недель.
? Ориентировочная стоимость — от 150 000 до 200 000 ? за полный рабочий прототип
(включая OCR, парсинг, валидацию и XML-генерацию).
После подписания NDA готов уточнить сроки и финальную смету под полное ТЗ.
Здравствуйте!
Меня зовут Андрей Мартынов, я представляю группу разработчиков – NC-1.
Более пяти лет мы создаем веб-сайты, мобильные приложения, интернет-магазины, ERP/CRM системы и другие e-commerce продукты. Над вашим проектом будет работать команда наших специалистов:
1. Project Manager
Стек: Jira/Confluence, Agile/Scrum, коммуникация с заказчиком
Задачи: управление проектом, сроки, требования, приемка этапов
2. Backend Developer (Python)
Стек: Python, FastAPI, PyMuPDF, Tesseract, lxml, PostgreSQL
Задачи: обработка PDF, OCR, извлечение данных, генерация XML
3. Frontend Developer
Стек: React + TypeScript, Material-UI, PDF.js, XML редактор
Задачи: интерфейс валидации, просмотр PDF, формы редактирования
4. ML/Data Engineer
Стек: Python, OpenCV, spaCy, дообучение OCR моделей
Задачи: повышение точности распознавания, извлечение таблиц
5. DevOps Engineer
Стек: Docker, AWS/GCP, CI/CD, мониторинг
Задачи: развертывание, настройка OCR сервисов, производительность
Кейсы https://1drv.ms/b/c/b7a0d31a9dae1bc5/EeH6JPdpBbpKtrkA1zFQOIMBF4gS47GaZUsAfO3xcL3HKQ?e=e3Lryi
Портфолио - https://ncomsoft.ru/
Мой телеграм - @Ncomsoft1
С уважением, Андрей М.
1. Есть ли примеры PDF-документов, с которыми должна работать система (скан/текст/смешанный формат)?
2. XML-схема уже финализирована, или возможны изменения?
Ваше решение это человеческий документо оборот
На базе предположем ELMA 365 или другой CRM системы
В ней все есть много готовых решений и не стоит изобретать велосипед.
Есть как онлайн версии так и Офлайн.
Приветствую, Данила! Я менеджер компании AV Studio https://avdeevstudio.ru/?utm_source=frelanc
Мы разрабатываем программное обеспечение для автоматизации бизнес-процессов. Реализуем систему для автоматизированного формирования отчетов с удобным интерфейсом, гибкими настройками и надежной архитектурой. Обеспечим стабильность, производительность и точное выполнение поставленных задач.
Присылайте ссылку на задание
Давайте обсудим детали в Телеграм: https://t.me/Avdeev_Vasiliy
По приложениям:
https://docs.google.com/document/d/1gzNOUaneYNXzBy9UuvOoyU0WU713wV_Q/edit?usp=sharing&ouid=116722294822589687319&rtpof=true&sd=true
Работы:
https://drive.google.com/file/d/1Qg4P1hoPKKccQyoJet7A7DcYgElze73o/view?usp=drive_link. – система управления компанией
написана с нуля, по срокам заняла 3 месяца phyton
https://drive.google.com/file/d/1px7bUSt2rLxmfkXoFHALWZuyg1s_oUm7/view?usp=sharing – браузерная онлайн игра, реализовано под фулл phyton+mongo
1. app 2. MongoDB 3. app game (WebScokets)
1. Игра (python FastAPI – websockets)
2. API python FastAPI – Админка + сохранение истории + настройка логики игры
3. Frontend часть – Vue.js
4. MongoDb чат и уведомлений
Последние работы:
leutin-ing.ru – проект на WordPress
ezway.pro – проект на WordPress
fcpa.work– проект на WordPress
dia-sg.com – проект на WordPress
jobspublisher.com – Html + php
remote-jobs.pro – Html + php
housepro.info – парсинг обьектов недвижимости Wordpress + кастомка
sellmyhouse.club – Html + php
ngs-smart.kz/- разработка на джанго
donjewellery.ru
mag-e.store/
Разработка программного обеспечения для автоматизированного формирования «Раздела 1. Пояснительная записка» проектной документации в формате XML.
Реклама
Разработка программного обеспечения для автоматизированного формирования «Раздела 1. Пояснительная записка» проектной документации в формате XML.
2. Описание проекта
Проект предполагает создание программного продукта (далее – Система), предназначенного для автоматизации процесса подготовки первого раздела проектной документации – «Пояснительная записка».
Основной сценарий работы Системы:
Пользователь загружает в Систему комплект документов в формате .PDF
(например, общую пояснительную записку, сканы ИРД и т.д.).
Система автоматически анализирует содержимое документов, извлекает необходимые данные (реквизиты, показатели, текстовые блоки) в соответствии со структурой целевой XML-схемы.
Извлечённые данные представляются пользователю в наглядном виде для проверки и согласования.
После подтверждения пользователем Система формирует итоговый XML-файл, полностью соответствующий требованиям актуальной XML-схемы (explanatorynote-01-05.xsd или более новой версии).
Внедрение Системы позволит радикально сократить ручной труд, стандартизировать процесс и минимизировать ошибки при формировании электронной проектной документации.
3. Цели и за...