Сбор данных (парсинг) по достопримечательностям из списка ссылок
Задание закрыто
Статус рабочей области:
Завершено
Стоимость:
3 000 рублей
Срок выполнения:
3 дня
Варианты оплаты:
По договоренности
Дата публикации:
2022-01-27 12:54
Был(а) на сайте:
2023-11-13 14:11
Реклама
Сбор данных (парсинг) по достопримечательностям из списка ссылок
Задача
Необходимо только собрать данные, сам скрипт не нужен.
Суть скрипта – собрать списки достопримечательностей из ссылок из таблицы source.xlsx и прописать их в результирующую таблицу ексель (формат записи данных предоставлю).
Работа скрипта : берём ссылку из source.xlsx, проходим по всем страницам пейджинга и записываем в результирующую таблицу все достопримечательности с количеством оценок более 100.
Если нет ни одной достопримечательности с количеством оценок более 100, то берём только первую по списку достопримечательность (но только если её рейтинг более 10). Если рейтинг её менее 10, то не выводим достопримечательностей по данному объекту результирующей таблице.
По итогу должна получиться результирующая таблица с названиями достопримечательностей и папка с изображениями (аватарками) этих достопримечательностей.
Готов обсудить ТЗ и приступить к выполнению задания. Имею опыт работы в данной сфере. Мой основной принцип работы, чтобы Вы были довольны! Для меня каждый проект имеет огромное значение и отношусь к разработке с особым вниманием и ответственностью.
Обращаю внимание на качество исполнения, сроки
Здравствуйте, 800 р/час.
Как Вы, возможно, помните из нашего прежнего опыта, парсинг 1 набора данных: от 1500 (PHP_CLI, на выходе - CSV или JSON). Конвертирование из/в XLSX: +1500.
Таким образом, стартовые 3000 - это только конвертер из source.xlsx и в "результирующую таблицу".
рейтинг более 10
- непонятно. На данном сайте рейтинг измеряется в "кружках" (e.g. "4,5 из 5 кружков") - просьба скорректировать задачу с учётом реальной методики вычисления рейтинга.
В моём случае, при сборе средствами разработчика без передачи кода бюджет создания сборщика заменяется бюджетом сбора, вычисляемым по ставке 800/час работы оборудования, с учётом "нежности" сбора, т.е. ограничения в ~1.25 стр/сек.
ссылок будет 4500 шт.
- учитывая, что в каждой, в среднем, по 4 страницы пагинации - это 18000стр. * 1.25сек. / 3600 (секунд в часе) = 6.25ч.
* 800 = 5000.
могу сделать. за эти деньги, но срок работы скрипта может быть достаточно большой + там наверняка есть защита от парсинга. ну и присоединяюсь к небольшим замечаниям из других предложений
Здравствуйте Иван!
Реализую задачу за 2 дня. Задачу реализую с помощью зеннопостера. Есть опыт парсинга информационных порталов и заливка на сайт, и парсинг контента с фейсбука. Задачу реализую грамотно, и предоставлю все в папках.
Спасибо!
С уважением,
Фрунзе!
Сбор данных (парсинг) по достопримечательностям из списка ссылок
Реклама
Сбор данных (парсинг) по достопримечательностям из списка ссылок
Необходимо только собрать данные, сам скрипт не нужен.
Суть скрипта – собрать списки достопримечательностей из ссылок из таблицы source.xlsx и прописать их в результирующую таблицу ексель (формат записи данных предоставлю).
Работа скрипта : берём ссылку из source.xlsx, проходим по всем страницам пейджинга и записываем в результирующую таблицу все достопримечательности с количеством оценок более 100.
Если нет ни одной достопримечательности с количеством оценок более 100, то берём только первую по списку достопримечательность (но только если её рейтинг более 10). Если рейтинг её менее 10, то не выводим достопримечательностей по данному объекту результирующей таблице.
По итогу должна получиться результирующая таблица с названиями достопримечательностей и папка с изображениями (аватарками) этих достопримечательностей.
Примеры ссылок
https://www.tripadvisor.ru/AttractionsNear-g1203006-d501020-Bandos_Maldives-Bandos.html
https://www.tripadvisor.ru/AttractionsNear-g1203006-d501020-Bandos_Maldives...
Другие открытые задания:
Доработать проект на Vue3 + VueBootstrap + Typescript2 000 р.
Бюджет: 2 000 р. Ищем человека на проектную работу, в дальнейшем возможно постоянное сотрудничество. Есть самописная система складского учета, необходимо отрефакторить код и добави…
Написание отзывов120 р.
Бюджет: 120 р. Здравствуйте, требуются работники для написания отзывов! Так же можем вам предложить разные виды работы. У меня всегда есть работа для каждого из вас! Мы берем всех…
Достать закрытое api ios приложения500 000 р.
Бюджет: 500 000 р. Нужен опытный реверсер который сможет реверснуть дейтинг приложение Bumble на ios, достать api и сделать бота для массовой регистрации + свайпов Требуется опыт раб…
поиск заданий