PHP парсер (точнее 6 парсераов)

Задание закрыто
Статус рабочей области:
Стоимость:Договорная
Срок выполнения:7 дней
Варианты оплаты:Без предоплаты
Дата публикации:2016-03-13 12:41
Был на сайте:2022-03-30 17:09

PHP парсер (точнее 6 парсераов)

 
Задача

Нужен скрипт, логика следующая (если парсинг какой-то системы невозможен - все обсуждаемо).
Запускать должен по крону.

1) К скрипту обращаются либо напрямую, либо с GET параметрами (IP, логин, пароль) – во втором случае скрипт должен работать через прокси, в первом без них. Время выполнения скрипта не ограничено.

2) При обращении, скрипт проверяет, есть ли в базе "поисковые слова" (далее – запросы) с отметкой 0. Если есть, то берет один запрос (рандомно) и переходит к пункту 4, если нет – то пункту 3.

3) Обращаемся к
https://export.yandex.ru/last/last20x.xml
Берем запросы, где found меньше определенного числа (выставляется в конфиге), кладем их в базу с пометкой 0 и переходим к пункту 2.

4) Переходим
https://www.flickr.com/search/?text=запрос
и берем урл первой картинки и вставляем в базу в виде тега картинки – img src. Если ничего нет, идем к пункту 5, если произошла ошибка (бан, или что-то еще) – нужно писать в отдельную таблицу/файл лог. Его структура в конце

5) Переходим на
http://...

Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Исполнитель по этому заданию выбран.
Заявок нет

Оставлять заявки могут только авторизованные пользователи.

Другие открытые задания:

поиск заданий