Программа для парсинга контента с сайта space.ru по всем имеющимся категориям, контент берется в виде html, а не просто текста и очищается от всех ссылок, потому может быть сразу использован без дополнительной обработки. Результаты сохраняются в файл excel.
Пример результата работы программ в прикрепленном файле.
Программа продается и рассматриваются проекты для парсинга сайтов на таком же движке или разработка парсера с нуля.