Нужен скрипт, логика следующая (если парсинг какой-то системы невозможен - все обсуждаемо). Запускать должен по крону.
1) К скрипту обращаются либо напрямую, либо с GET параметрами (IP, логин, пароль) – во втором случае скрипт должен работать через прокси, в первом без них. Время выполнения скрипта не ограничено.
2) При обращении, скрипт проверяет, есть ли в базе "поисковые слова" (далее – запросы) с отметкой 0. Если есть, то берет один запрос (рандомно) и переходит к пункту 4, если нет – то пункту 3.
3) Обращаемся к https://export.yandex.ru/last/last20x.xml Берем запросы, где found меньше определенного числа (выставляется в конфиге), кладем их в базу с пометкой 0 и переходим к пункту 2.
4) Переходим https://www.flickr.com/search/?text=запрос и берем урл первой картинки и вставляем в базу в виде тега картинки – img src. Если ничего нет, идем к пункту 5, если произошла ошибка (бан, или что-то еще) – нужно писать в отдельную таблицу/файл лог. Его структура в конце
5) Переходим на http://...
Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Исполнитель по этому заданию выбран.
Заявок нет
Оставлять заявки могут только авторизованные пользователи.
PHP парсер (точнее 6 парсераов)
Реклама
PHP парсер (точнее 6 парсераов)
Нужен скрипт, логика следующая (если парсинг какой-то системы невозможен - все обсуждаемо).
Запускать должен по крону.
1) К скрипту обращаются либо напрямую, либо с GET параметрами (IP, логин, пароль) – во втором случае скрипт должен работать через прокси, в первом без них. Время выполнения скрипта не ограничено.
2) При обращении, скрипт проверяет, есть ли в базе "поисковые слова" (далее – запросы) с отметкой 0. Если есть, то берет один запрос (рандомно) и переходит к пункту 4, если нет – то пункту 3.
3) Обращаемся к
https://export.yandex.ru/last/last20x.xml
Берем запросы, где found меньше определенного числа (выставляется в конфиге), кладем их в базу с пометкой 0 и переходим к пункту 2.
4) Переходим
https://www.flickr.com/search/?text=запрос
и берем урл первой картинки и вставляем в базу в виде тега картинки – img src. Если ничего нет, идем к пункту 5, если произошла ошибка (бан, или что-то еще) – нужно писать в отдельную таблицу/файл лог. Его структура в конце
5) Переходим на
http://...