По ссылке в интернете есть большой текстовый файл (начальное расширение .xls), размер более 3 Gb. Содержимое строк файла примерно такое:
-----
<offer available="true" id="689689678"><brand-name>Пружина передняя Lesjofors</brand-name><normal-price>2700.00</normal-price><url>https://site.ru</url><image>https://site.ru/site.jpeg</image></offer>
-----
Нужна программа под Windows (язык не важен), которая:
1. Скачивает данный файл (через браузер скачивается нормально, имеющаяся сейчас программа останавливает загрузку примерно на 750 Mb);
2. Собирает из файла построчно теги с содержимым согласно настройкам, лучше если настройки - это файл .txt, в котором указаны теги, пример, файл tegi.txt:
-----
url
image
lower-price
normal-price
brand-name
text
-----
3. Пишет в папку result файлы .txt с содержимым указанных тегов, включая сами теги по 50 000 строк, пример результата:
-----
<brand-name>Пружина передняя Lesjo...
Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Обработка текстового файла
Реклама
Обработка текстового файла
По ссылке в интернете есть большой текстовый файл (начальное расширение .xls), размер более 3 Gb. Содержимое строк файла примерно такое:
-----
<offer available="true" id="689689678"><brand-name>Пружина передняя Lesjofors</brand-name><normal-price>2700.00</normal-price><url>https://site.ru</url><image>https://site.ru/site.jpeg</image></offer>
-----
Нужна программа под Windows (язык не важен), которая:
1. Скачивает данный файл (через браузер скачивается нормально, имеющаяся сейчас программа останавливает загрузку примерно на 750 Mb);
2. Собирает из файла построчно теги с содержимым согласно настройкам, лучше если настройки - это файл .txt, в котором указаны теги, пример, файл tegi.txt:
-----
url
image
lower-price
normal-price
brand-name
text
-----
3. Пишет в папку result файлы .txt с содержимым указанных тегов, включая сами теги по 50 000 строк, пример результата:
-----
<brand-name>Пружина передняя Lesjo...