1. Цель работы
Перевод данных из PDF-каталогов и изображений (медицинское оборудование) в структурированный формат Markdown-таблиц, пригодный для прямой вставки в Excel / Google Таблицы. Направление МЕДИЦИНСКИЕ ТОВАРЫ. ЕСТЬ СВОЯ СПЕЦИФИКА ДАННЫХ.
2. Формат результата
Формат: Markdown-таблица.
Совместимость: Данные должны быть очищены и отформатированы так, чтобы после копирования в Excel они корректно распределялись по ячейкам без необходимости ручной правки.
Специальное требование для Excel: Перед каждым числовым значением необходимо ставить апостроф ('). Это предотвращает автоматическую конвертацию чисел в даты или потерю ведущих нулей.
3. Требования к структуре данных
Исполнитель обязан соблюдать следующие правила формирования столбцов:
Разделение характеристик: Если характеристика имеет две единицы измерения (например, диаметр в дюймах и мм, давление в атм и кПа, интродьюсер в F и мм), они обязаны быть разбиты на два отдельных числовых столбца.
Пример: Вместо "7 F / 2.33 мм" должно быть два столбца: Интродьюсер (F) и Интродьюсер (мм).
Обязательные столбцы: Артикул, Наименование модели, все числовые характеристики.
Уникальные параметры: Специфические характеристики (например, «нагрузка на кончик», «форма кончика») должны быть вынесены в отдельные столбцы.
Построчное представление: Артикулы разных размеров/длин должны идти отдельными строками, а не объединяться в одну ячейку.
4. Качество данных
Очистка: В числовых ячейках (физические величины) оставлять только числа. Текст (например, «г», «см», «атм») в самих ячейках указывать нельзя.
Полнота: Необходимо извлечь данные из всех таблиц во всех страницах документа.
Контекст: Данные, указанные в заголовках над таблицами, должны быть интегрированы в общую строку товара как характеристики.
Единообразие: Если в документе несколько видов продукции (например, проводники и баллоны), необходимо либо создать единую мастер-таблицу, либо четко разделить их заголовками, сохраняя единообразие структуры столбцов.
5. Критерии приемки
Отсутствие «мусора»: В таблице нет лишних символов, примечаний или пояснений внутри числовых ячеек.
Валидность: Данные корректно импортируются в Excel (не съезжают столбцы, числа распознаются корректно благодаря апострофам).
Полнота: Количество строк в итоговой таблице соответствует количеству позиций в исходном PDF.
Примечание для исполнителя:
Работа требует предельной педантичности. Упрощения, нарушающие структуру или чистоту данных, недопустимы. Если структура исходной таблицы в PDF неоднозначна, перед началом работ необходимо согласовать логику разделения столбцов с заказчиком.
Пример каталога прикреплён, всего по объему будет таких минимум 5 каталогов, максимум 10.
Пример Экселя прикреплен. все данные должны быть внесены, если названия для столбца отсутствует, значит добавляется новый.
жетали обсудим после договорённости. Цену обсуждаем.