Проект направлен на автоматизацию процесса сбора и структурирования данных с сайта https://ankas.ru/. Целью является извлечение информации о товарах, таких как название, описание, цены и другие характеристики, для дальнейшего использования в различных целях, например, для ведения базы данных или анализа рынка.
Для реализации данного проекта был использован следующий стек технологий:
Python - в качестве основного языка программирования;
Библиотека requests - для выполнения HTTP-запросов к сайту;
Библиотека BeautifulSoup4 (bs4) - для парсинга HTML-кода страниц и извлечения необходимой информации;
Библиотека openpyxl - для записи собранных данных в Excel-файл;
Библиотека json - для записи данных в формате JSON.
Алгоритм работы программы:
Отправка HTTP-запроса к сайту ankas.ru для получения HTML-кода страниц каталога.
Парсинг HTML-кода с использованием BeautifulSoup4 для извлечения информации о товарах: название, описание, цена, изображение и другие характеристики.
Структурирование собранных данных в виде таблицы или JSON-объекта.
Сохранение данных в формате Excel (.xlsx) или JSON.
В результате работы программы была создана структурированная база данных товаров, доступная в виде Excel-файла или JSON-файла. Данная информация может быть использована для дальнейшего анализа, ведения учета, интеграции с другими системами и т.д.