Данный проект посвящен парсингу каталога товаров с сайта pkf-m.ru - российской компании, занимающейся производством и продажей строительных материалов. Целью проекта является сбор и структурирование данных о продукции компании для дальнейшего анализа и использования в различных бизнес-процессах.
Для реализации проекта были использованы следующие технологии и инструменты:
Python - основной язык программирования
requests - библиотека для выполнения HTTP-запросов к сайту
BeautifulSoup - библиотека для парсинга HTML-данных
json - для работы с данными в формате JSON
excel - для сохранения и структурирования собранных данных в таблицы
Процесс реализации проекта включал в себя следующие этапы:
Анализ структуры и содержимого сайта pkf-m.ru для определения подходящих методов парсинга.
Разработка скрипта на Python, который:Отправляет HTTP-запросы на сайт для получения HTML-страниц каталога
Использует BeautifulSoup для извлечения необходимой информации (названия, описания, цены, изображений и т.д.)
Сохраняет данные в формате JSON
Преобразование данных из JSON-формата в структурированные таблицы Excel для удобного использования.
В результате выполнения проекта была создана программа, которая позволяет:
Автоматически парсить каталог товаров с сайта pkf-m.ru
Сохранять собранные данные в удобном табличном формате (Excel)
Предоставлять структурированную информацию о продукции компании для дальнейшего анализа и использования в бизнес-процессах
Данный проект демонстрирует навыки работы с Python, парсингом веб-страниц, обработкой и структурированием данных, а также может быть использован как основа для различных бизнес-приложений.
cloud.mail.ru/public/YvKj/LKBvSaCMd cloud.mail.ru/public/1YQV/HSDpD3PLb