Автоматизирую бизнес – код работает, вы зарабатываете

Андрей Гринченко seikacu

Рейтинг: 79
не верифицирован
Всего отзывов: 0
  • Работ в портфолио: 19
  • Типовых услуг: 6
  • Работ на продажу: 0
  • Образование: Магистратура
  • Стаж работы: 14 лет
  • Юридический статус:Самозанятый
Был на сайте:

Парсер сайта объявлений

Используемые навыки:

Описание

Парсер собирает данные с объявлений по категориям и выводит результат в csv файл. Парсер написан на языке python с использованием стека: Selenium, Beautiful Soup, Requests, Tkinter, PostgreSQL, asyncio, aiohttp, threading, ruCaptcha, proxy. Работает в нескольких режимах. Сначала выбирается категория, затем происходит сбор ссылок объявлений по заданной категории, затем идет сам сбор данных. В процессе сбора данных на сайте присутствует информация, которая скрыта за капчей, парсер решает ее, и записывает полученные данные в БД. Сбор данных осуществляется в 2- режимах: однопоточном и многопоточном (от 10 до 20 потоков), что ускоряет сбор данных. Сбор исходных данных (ссылок) также осуществляется в асинхронном многопоточном режиме до 30 потоков.

Презентация проекта

pic4643284.jpg

Оценили проект:

0