Рейтинг: 176
не верифицирован
Всего отзывов: 0
  • Работ в портфолио: 14
  • Типовых услуг: 0
  • Работ на продажу: 0
  • Стаж работы: 3 года
  • Зарегистрирован: 29.03.2026
  • Образование: Cпециалитет
  • Юридический статус:Частное лицо
  • Стоимость услуг (руб): 2 000 за час 80 000 за месяц
Был на сайте:

Komus.ru Parser: Selenium-парсер с обходом Cloudflare для сбора данных о товарах

Используемые навыки:

Описание

Заказчику требовалось автоматически получать актуальные данные о товарах с сайта Komus.ru (название, артикул, цена, наличие) через защищённый API-эндпоинт. Основная сложность — ресурс защищён Cloudflare, который блокирует стандартные запросы и детектирует автоматизацию. Задача: создать стабильный инструмент, который обходит защиту, извлекает чистые JSON-данные по коду товара и сохраняет их для дальнейшей интеграции с учётом, аналитикой или прайс-агрегаторами.

Решение

• Реализовала парсер на Python + Selenium с эмуляцией реального браузера: ротация user-agent, отключение флагов автоматизации, маскировка navigator.webdriver.
• Настроила динамическое ожидание для прохождения проверок Cloudflare.
• Добавила обработку ошибок: при неудаче сохраняется HTML-снапшот страницы для отладки, предусмотрен fallback-режим с видимым браузером для ручного контроля.
• Реализовала парсинг и валидацию JSON-ответа, извлечение ключевых полей товара и сохранение в структурированный JSON-файл.
• Обеспечила гибкость запуска: режим headless для продакшена и видимый режим для отладки, автоустановка драйвера через webdriver-manager.

Результат

Инструмент стабильно извлекает данные о товарах даже при активной защите Cloudflare, минимизируя ложные срабатывания и блокировки. Полученные JSON-данные готовы к импорту в 1С, CRM-системы, прайс-менеджеры или аналитические дашборды. Архитектура модульная: легко адаптировать под другие эндпоинты Komus или аналогичные защищённые сайты. При необходимости можно масштабировать решение для пакетного парсинга каталога с очередью задач и логированием.

Презентация проекта

komus.png

Оценили проект:

0