Необходимо отпарсить PDF файл, и полученный текст обработать и вывести в таблицу
Задание закрыто
Стоимость:
Договорная
Срок выполнения:
6 дней
Варианты оплаты:
По договоренности
Дата публикации:
2016-02-09 15:21
Был на сайте:
2019-11-20 16:38
Реклама
Необходимо отпарсить PDF файл, и полученный текст обработать и вывести в таблицу
Задача
Есть определенный сайт, на котором каждый день (за исключением выходных) выкладываются простые текстовые PDF'ы (с графической разметкой). Пример такой PDF'ки - http://www.filehosting.org/file/details/540940/BRM_2016_01_19.pdf Этот pdf нужно будет с этого сайта выкачивать к себе (на сервер сайта-назначения), и использовать как источник данных (т.е. распарсить его и вытащить оттуда текстовые данные, в интернете полно открытых pdf-парсеров которые с этим PDFом справляются на ура), и потом эти данные в последствии необходимо перегонять в json (для внутреннего хранения, и последующего простого доступа, без надобности ре-парсить по новой), и отображать уже на сайте-назначения в таблице. Сайт этот готов (выглядит он так - http://puu.sh/mVXan/c66483a7d0.png), и там уже используется один источник данных (правда, в формате csv) для совершенно подобных же целей. По сути, к уже имеющемуся источнику данных, нужно будет добавить ещё один.
Если вам интересен проект, пишите пожалуйста сразу в скайп - internat1onale
Оставлять заявки могут только авторизованные пользователи.
Заявок нет
Оставлять заявки могут только авторизованные пользователи.
Необходимо отпарсить PDF файл, и полученный текст обработать и вывести в таблицу
Реклама
Необходимо отпарсить PDF файл, и полученный текст обработать и вывести в таблицу
Есть определенный сайт, на котором каждый день (за исключением выходных) выкладываются простые текстовые PDF'ы (с графической разметкой).
Пример такой PDF'ки - http://www.filehosting.org/file/details/540940/BRM_2016_01_19.pdf
Этот pdf нужно будет с этого сайта выкачивать к себе (на сервер сайта-назначения), и использовать как источник данных (т.е. распарсить его и вытащить оттуда текстовые данные, в интернете полно открытых pdf-парсеров которые с этим PDFом справляются на ура), и потом эти данные в последствии необходимо перегонять в json (для внутреннего хранения, и последующего простого доступа, без надобности ре-парсить по новой), и отображать уже на сайте-назначения в таблице. Сайт этот готов (выглядит он так - http://puu.sh/mVXan/c66483a7d0.png), и там уже используется один источник данных (правда, в формате csv) для совершенно подобных же целей.
По сути, к уже имеющемуся источнику данных, нужно будет добавить ещё один.
Если вам интересен проект, пишите пожалуйста сразу в скайп - internat1onale