Типовое windows-приложение, собирающее информацию с сайтов и сохраняющее её в нужный формат. Данные форматируются: удаляются лишние пробелы, спец. символы, не нужная html разметка и т.д.
Уже реализованы парсеры для сайтов:
https://goszakup.gov.kz/
https://www.sima-land.ru/
https://www.citilink.ru/
https://www.pleer.ru/
https://rarbgmirror.xyz/
https://arxiv.org/
http://bs.energizerautomotivebatteries.com