Необходимо написать программу, которая сможет распарсить любое издание (прошлое или будущее) каталога KRAUSE Standard Catalog of World Coins. 2001-Date (формат PDF) в csv-файл, а также каталоги монет за период до 2001 года.
Файл защищен паролем. Кроме того, один из претендентов на выполнение работы выявил следующие сложности:
1. Картинки монет разбиты на куски, целыми всех достать не получится. 2. Основной текст с описанием параметров монет закодирован в каком-то бинарном коде, возможно это картинка (не уверен). Поэтому даже если бы у вас было разрешение копировать текст, то вы бы не могли копировать текст с описанием монет, так как внутри он сохранён не как текст. Автор хорошо обезопасил файл от копирования, довольно хитро.
На выходе хочу получить программу, состоящую из оболочки для парсинга и отдельного файла-модуля, содержащего логику парсинга данных именно из указанного типа каталогов Краузе.
Это нужно для того, чтобы в будущем можно было дозаказать новый модуль для парсинга какого-либо другого кат...
Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Исполнитель по этому заданию выбран.
Заявок нет
Оставлять заявки могут только авторизованные пользователи.
Распарсить зашифрованный PDF файл
Реклама
Распарсить зашифрованный PDF файл
Необходимо написать программу, которая сможет распарсить любое издание (прошлое или будущее) каталога KRAUSE Standard Catalog of World Coins. 2001-Date (формат PDF) в csv-файл, а также каталоги монет за период до 2001 года.
Файл защищен паролем. Кроме того, один из претендентов на выполнение работы выявил следующие сложности:
1. Картинки монет разбиты на куски, целыми всех достать не получится.
2. Основной текст с описанием параметров монет закодирован в каком-то бинарном коде,
возможно это картинка (не уверен). Поэтому даже если бы у вас было разрешение копировать текст, то вы бы не могли копировать текст с описанием монет, так как внутри он сохранён не как текст. Автор хорошо обезопасил файл от копирования, довольно хитро.
На выходе хочу получить программу, состоящую из оболочки для парсинга и отдельного файла-модуля, содержащего логику парсинга данных именно из указанного типа каталогов Краузе.
Это нужно для того, чтобы в будущем можно было дозаказать новый модуль для парсинга какого-либо другого кат...
Другие открытые задания:
Движок на Python для извлечения табличных частей из doc docx pdf10 000 р.
Бюджет: 10 000 р. Краткое описание. Реализовать движок и методы Python 1) выборка из базы ссылок на файлы, скачивает файл который может быть doc, docx, rtf или pdf. 2) из к…
Написать письмо-приглашение на вебинар 500 р.
Бюджет: 500 р. Ищу человека, который будет регулярно помогать писать письма-приглашения на продающие вебинары.
Менеджер по привлечению клиентов200 000 р.
Бюджет: 200 000 р. Условия: 1. Холодный поиск клиентов онлайн/оффлайн 2. Оплата: мы называем вам стоимость работ, а вы добавляете свою комиссию сверх нашей суммы 3. Средний чек: 10…
поиск заданий