Требуется простейший скрипт парсинга одного раздела Авито. Выкладывается на дешевый хостинг, без домена, без дизайна и с элементарным интерфейсом.
Обязательные функции: - беспрерывный парсинг; - проверка на дубли; - экспорт очищенных от дублей списков.
Схема такая: 1. Задается режим парсинга. Например, задано что каждых 15 минут автоматически проверяется наличие новых объявлений в нужном нам разделе источника. 2. Все новые объявления сверяются с уже имеющейся базой объявлений (ее храним некоторое время) на предмет наличия дублей. 3. Дубли отсеиваются, уникальные записываются в чистовые списки.с возможностью экспорта в двух форматах - csv и txt. Формат файлов предоставится дополнительно. Т.е. парсинг идет непрерывно, оператор заходит на страницу парсера и в нужный ему момент выгружает чистовые списки.
Также обязательно нужна наглядная статистика - сколько есть записей к выгрузке на текущий момент, когда и сколько было выгружено в предыдущий раз и т.п. Обсудим дополнительно.
Ничего сложного, как видите....
Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Заявок нет
Оставлять заявки могут только авторизованные пользователи.
Простейший парсер объявлений Авито
Реклама
Простейший парсер объявлений Авито
Требуется простейший скрипт парсинга одного раздела Авито. Выкладывается на дешевый хостинг, без домена, без дизайна и с элементарным интерфейсом.
Обязательные функции:
- беспрерывный парсинг;
- проверка на дубли;
- экспорт очищенных от дублей списков.
Схема такая:
1. Задается режим парсинга. Например, задано что каждых 15 минут автоматически проверяется наличие новых объявлений в нужном нам разделе источника.
2. Все новые объявления сверяются с уже имеющейся базой объявлений (ее храним некоторое время) на предмет наличия дублей.
3. Дубли отсеиваются, уникальные записываются в чистовые списки.с возможностью экспорта в двух форматах - csv и txt. Формат файлов предоставится дополнительно.
Т.е. парсинг идет непрерывно, оператор заходит на страницу парсера и в нужный ему момент выгружает чистовые списки.
Также обязательно нужна наглядная статистика - сколько есть записей к выгрузке на текущий момент, когда и сколько было выгружено в предыдущий раз и т.п. Обсудим дополнительно.
Ничего сложного, как видите....