Парсер ищет URL в файле лога по ключевым словам в тегах <topic> и с фильтром по сайтам. Найденные домены записываются в txt файл.
Часть файла лога:
….
<ExternalPage about="http://www.delvine.co.za">
<d:Title>Delvine Eiendomme</d:Title>
<d:Description>Eiendomsagente vir Noordoos-Pretoria, Suid-Afrika.</d:Description>
<topic>Top/World/Afrikaans/Besigheid</topic>
</ExternalPage>
….
100$ - 1 день