Сбор данных (парсинг) по достопримечательностям из списка ссылок
Задание закрыто
Статус рабочей области:
Завершено
Стоимость:
3 000 рублей
Срок выполнения:
3 дня
Варианты оплаты:
По договоренности
Дата публикации:
2022-01-27 12:54
Был(а) на сайте:
2023-11-13 14:11
Реклама
Сбор данных (парсинг) по достопримечательностям из списка ссылок
Задача
Необходимо только собрать данные, сам скрипт не нужен.
Суть скрипта – собрать списки достопримечательностей из ссылок из таблицы source.xlsx и прописать их в результирующую таблицу ексель (формат записи данных предоставлю).
Работа скрипта : берём ссылку из source.xlsx, проходим по всем страницам пейджинга и записываем в результирующую таблицу все достопримечательности с количеством оценок более 100.
Если нет ни одной достопримечательности с количеством оценок более 100, то берём только первую по списку достопримечательность (но только если её рейтинг более 10). Если рейтинг её менее 10, то не выводим достопримечательностей по данному объекту результирующей таблице.
По итогу должна получиться результирующая таблица с названиями достопримечательностей и папка с изображениями (аватарками) этих достопримечательностей.
Готов обсудить ТЗ и приступить к выполнению задания. Имею опыт работы в данной сфере. Мой основной принцип работы, чтобы Вы были довольны! Для меня каждый проект имеет огромное значение и отношусь к разработке с особым вниманием и ответственностью.
Обращаю внимание на качество исполнения, сроки
Здравствуйте, 800 р/час.
Как Вы, возможно, помните из нашего прежнего опыта, парсинг 1 набора данных: от 1500 (PHP_CLI, на выходе - CSV или JSON). Конвертирование из/в XLSX: +1500.
Таким образом, стартовые 3000 - это только конвертер из source.xlsx и в "результирующую таблицу".
рейтинг более 10
- непонятно. На данном сайте рейтинг измеряется в "кружках" (e.g. "4,5 из 5 кружков") - просьба скорректировать задачу с учётом реальной методики вычисления рейтинга.
В моём случае, при сборе средствами разработчика без передачи кода бюджет создания сборщика заменяется бюджетом сбора, вычисляемым по ставке 800/час работы оборудования, с учётом "нежности" сбора, т.е. ограничения в ~1.25 стр/сек.
ссылок будет 4500 шт.
- учитывая, что в каждой, в среднем, по 4 страницы пагинации - это 18000стр. * 1.25сек. / 3600 (секунд в часе) = 6.25ч.
* 800 = 5000.
могу сделать. за эти деньги, но срок работы скрипта может быть достаточно большой + там наверняка есть защита от парсинга. ну и присоединяюсь к небольшим замечаниям из других предложений
Здравствуйте Иван!
Реализую задачу за 2 дня. Задачу реализую с помощью зеннопостера. Есть опыт парсинга информационных порталов и заливка на сайт, и парсинг контента с фейсбука. Задачу реализую грамотно, и предоставлю все в папках.
Спасибо!
С уважением,
Фрунзе!
Сбор данных (парсинг) по достопримечательностям из списка ссылок
Реклама
Сбор данных (парсинг) по достопримечательностям из списка ссылок
Необходимо только собрать данные, сам скрипт не нужен.
Суть скрипта – собрать списки достопримечательностей из ссылок из таблицы source.xlsx и прописать их в результирующую таблицу ексель (формат записи данных предоставлю).
Работа скрипта : берём ссылку из source.xlsx, проходим по всем страницам пейджинга и записываем в результирующую таблицу все достопримечательности с количеством оценок более 100.
Если нет ни одной достопримечательности с количеством оценок более 100, то берём только первую по списку достопримечательность (но только если её рейтинг более 10). Если рейтинг её менее 10, то не выводим достопримечательностей по данному объекту результирующей таблице.
По итогу должна получиться результирующая таблица с названиями достопримечательностей и папка с изображениями (аватарками) этих достопримечательностей.
Примеры ссылок
https://www.tripadvisor.ru/AttractionsNear-g1203006-d501020-Bandos_Maldives-Bandos.html
https://www.tripadvisor.ru/AttractionsNear-g1203006-d501020-Bandos_Maldives...
Другие открытые задания:
Доделать сайт (формы обратной связи, форму заказа, визуал и тд)8 000 р.
Бюджет: 8 000 р. Сайты на WordPress (2 шт), на нашем хостинге: корпоративный (собран на Elementor) и интернет-магазин (Elementor + woocommerce). Доступы в админку и к файлам на хост…
Написание отзывов на геоплощадках(яндекс,гугл, 2гис)500 р.
Бюджет: 500 р. тг ··· Все в лс
Привлечение партнеров (без звонков) удаленно 50 000 р.
Бюджет: 50 000 р. Всех приветствую кто ищет работу /подработку ! Эта работа удаленная , где вы сами выбираете сколько будете тратить на неё время (доход будет зависеть только от вас)…
поиск заданий