Рейтинг: 20
не верифицирован
Всего отзывов: 0
  • Работ в портфолио: 3
  • Типовых услуг: 0
  • Работ на продажу: 0
  • Зарегистрирован: 22.04.2026
Был на сайте:

Парсер Федресурса (обход анти-бот, 30k+ записей/день)

Описание

Клиенту нужна была ежедневная выгрузка всех новых банкротств и сообщений конкурсных управляющих из публичного реестра Федресурс. Сайт защищён Cloudflare и JA3-fingerprint — обычный requests/httpx заблокирован.

Решение

Написал асинхронный парсер на Python 3.12 с curl_cffi (JA3-отпечаток Chrome 120) и ротацией резидентных прокси. Инкрементальная загрузка через Redis-курсор, Celery beat для периодического запуска. Нормализатор данных на pydantic v2.

Результат

30 000+ записей в день без банов. Парсер работает 24/7. Клиент получает автоматические выгрузки по расписанию.

Презентация проекта

case1_parser_fedresurs.png

Оценили проект:

0