Сбор данных (парсинг) по достопримечательностям из списка ссылок
Задание закрыто
Статус рабочей области:
Завершено
Стоимость:
3 000 рублей
Срок выполнения:
3 дня
Варианты оплаты:
По договоренности
Дата публикации:
2022-01-27 12:54
Был(а) на сайте:
2023-11-13 14:11
Реклама
Сбор данных (парсинг) по достопримечательностям из списка ссылок
Задача
Необходимо только собрать данные, сам скрипт не нужен.
Суть скрипта – собрать списки достопримечательностей из ссылок из таблицы source.xlsx и прописать их в результирующую таблицу ексель (формат записи данных предоставлю).
Работа скрипта : берём ссылку из source.xlsx, проходим по всем страницам пейджинга и записываем в результирующую таблицу все достопримечательности с количеством оценок более 100.
Если нет ни одной достопримечательности с количеством оценок более 100, то берём только первую по списку достопримечательность (но только если её рейтинг более 10). Если рейтинг её менее 10, то не выводим достопримечательностей по данному объекту результирующей таблице.
По итогу должна получиться результирующая таблица с названиями достопримечательностей и папка с изображениями (аватарками) этих достопримечательностей.
Готов обсудить ТЗ и приступить к выполнению задания. Имею опыт работы в данной сфере. Мой основной принцип работы, чтобы Вы были довольны! Для меня каждый проект имеет огромное значение и отношусь к разработке с особым вниманием и ответственностью.
Обращаю внимание на качество исполнения, сроки
Здравствуйте, 800 р/час.
Как Вы, возможно, помните из нашего прежнего опыта, парсинг 1 набора данных: от 1500 (PHP_CLI, на выходе - CSV или JSON). Конвертирование из/в XLSX: +1500.
Таким образом, стартовые 3000 - это только конвертер из source.xlsx и в "результирующую таблицу".
рейтинг более 10
- непонятно. На данном сайте рейтинг измеряется в "кружках" (e.g. "4,5 из 5 кружков") - просьба скорректировать задачу с учётом реальной методики вычисления рейтинга.
В моём случае, при сборе средствами разработчика без передачи кода бюджет создания сборщика заменяется бюджетом сбора, вычисляемым по ставке 800/час работы оборудования, с учётом "нежности" сбора, т.е. ограничения в ~1.25 стр/сек.
ссылок будет 4500 шт.
- учитывая, что в каждой, в среднем, по 4 страницы пагинации - это 18000стр. * 1.25сек. / 3600 (секунд в часе) = 6.25ч.
* 800 = 5000.
могу сделать. за эти деньги, но срок работы скрипта может быть достаточно большой + там наверняка есть защита от парсинга. ну и присоединяюсь к небольшим замечаниям из других предложений
Здравствуйте Иван!
Реализую задачу за 2 дня. Задачу реализую с помощью зеннопостера. Есть опыт парсинга информационных порталов и заливка на сайт, и парсинг контента с фейсбука. Задачу реализую грамотно, и предоставлю все в папках.
Спасибо!
С уважением,
Фрунзе!
Сбор данных (парсинг) по достопримечательностям из списка ссылок
Реклама
Сбор данных (парсинг) по достопримечательностям из списка ссылок
Необходимо только собрать данные, сам скрипт не нужен.
Суть скрипта – собрать списки достопримечательностей из ссылок из таблицы source.xlsx и прописать их в результирующую таблицу ексель (формат записи данных предоставлю).
Работа скрипта : берём ссылку из source.xlsx, проходим по всем страницам пейджинга и записываем в результирующую таблицу все достопримечательности с количеством оценок более 100.
Если нет ни одной достопримечательности с количеством оценок более 100, то берём только первую по списку достопримечательность (но только если её рейтинг более 10). Если рейтинг её менее 10, то не выводим достопримечательностей по данному объекту результирующей таблице.
По итогу должна получиться результирующая таблица с названиями достопримечательностей и папка с изображениями (аватарками) этих достопримечательностей.
Примеры ссылок
https://www.tripadvisor.ru/AttractionsNear-g1203006-d501020-Bandos_Maldives-Bandos.html
https://www.tripadvisor.ru/AttractionsNear-g1203006-d501020-Bandos_Maldives...
Другие открытые задания:
Разработать многостраничный сайт компании (не на Тильде) с автоматической загрузкой данных в таблицу на одной из страниц.117 000 р.
Бюджет: 117 000 р. 1. Многостраничный сайт зарубежной компании на английском языке, без CEO продвижения 2. В цветовых и дизайнерских решениях необходимо опираться на сайт https://w…
Необходимо написать отзывы200 р.
Бюджет: 200 р. Необходимо написать отзывы компании. Можно без опыта. Писать t.me/olgavologzhina
Оператор в чат без звонков 20 000 р.
Бюджет: 20 000 р. ПИСАТЬ В ТЕЛЕГРАММ: lovbess_9 Требуются работники для удаленной работы. Время работы может составлять от 2 часов в день, в зависимости от вашей доступности. …
поиск заданий