Николай Мельников nic11371 Паспорт верифицирован
От идеи до кода — быстро и чисто.
Рейтинг
282
№ 4 096 в каталоге
Отзывы
0
Профессионализм
-/10
Коммуникация
- /10
Город
Москва
Опыт работы
2 года
На сайте с
2020 года
Юридический статус
Самозанятый

Парсер карточек товаров

Используемые навыки BeautifulSoup Python

Описание

Разработан асинхронный парсер интернет-магазина на Python с использованием библиотеки BeautifulSoup для сбора информации о товарах (название, артикул, цена) с сайта. Парсер автоматически проходит по всем категориям, страницам и карточкам товаров. Парсер асинхронный, что позволяет быстро собирать большие объемы данных.

Решение

Использована библиотека BeautifulSoup для парсинга HTML.
Реализована асинхронность с помощью aiohttp и asyncio для ускорения сбора данных с карточек товаров.
Сначала собираются все категории и страницы через requests, затем происходит асинхронный обход карточек.
Для каждой карточки собирается название товара, артикул, цена, ссылка на карточку.

Результат

Собраны данные со всех товаров сайта в кратчайшие сроки благодаря асинхронности.
Парсер корректно обходит категории, страницы и карточки.
Вывод данных осуществляется в консоль (при необходимости можно легко адаптировать под сохранение в JSON, CSV или базу данных).
Код масштабируемый и готов к расширению: добавлению логирования, сбора дополнительных параметров, сохранению в БД.

Оценили проект:

Другие проекты

Все проекты →
Веб-разработка и IT Дашбоард конверсий
Дашбоард конверсий
102
Искусственный интеллект RAG и Research агент
RAG и Research агент
46
Веб-разработка и IT Парсер сообщений Telegram каналов
Парсер сообщений Telegram каналов
112
Веб-разработка и IT Telegram-бот для проверки подписок и рассылки
Telegram-бот для проверки подписок и рассылки
192