Цель данного проекта - создание инструмента для автоматического сбора и структурирования данных с сайта https://secondtool.ru/, где представлен каталог подержанных промышленных станков. Это позволит пользователям быстро находить и анализировать интересующие предложения.
Для реализации проекта были использованы следующие технологии:
Python - как основной язык программирования
Библиотека requests - для отправки HTTP-запросов
Библиотека BeautifulSoup (bs4) - для парсинга HTML-кода страниц
Форматы данных XLSX и JSON - для сохранения результатов парсинга
Программа последовательно выполняет следующие шаги:
Отправляет запросы на страницы каталога и получает HTML-код
Обрабатывает HTML-код с помощью BeautifulSoup для извлечения необходимой информации
Сохраняет данные в виде таблицы Excel (.xlsx) и JSON-файла
В результате работы программы формируется структурированная база данных со всеми доступными на сайте предложениями по продаже подержанного промышленного оборудования. Пользователи могут загрузить эти данные и использовать их для поиска, сравнения и анализа интересующих позиций.
cloud.mail.ru/public/752L/ghnUhgmqH cloud.mail.ru/public/aitr/95AyfG4Rp