Имеется большой массив названий товаров, как правило, включающий в себя вид товара, производителя, марку и прочую информацию.
Нужно написать скрипт на Python, который разбивает данные заголовки на составляющие, используя регулярные выражения и заранее подготовленные словари.
Например, заголовок «Наручные часы CASIO MTP-V004L-1B»
Разбиваются на:
Вид товара: наручные часы
Производитель: Casio
Модель: MTP-V004L-1B
В предложении, пожалуйста, укажите:
1. Работали ли вы ранее с регулярными выражениями на Python.
2. Какая стоимость вашей работы в час.
3. Сколько часов в день вы сможете уделить этой задаче в ближайшее время.
Спасибо.
Оставлять заявки могут только авторизованные пользователи.
Добрый день, готов помочь с вашей задачей.
Выглядит как задача на час-два, но возможны нюансы который растянут выполнение, чтобы их прояснить, несколько вопросов:
1. Насколько грязные исходные данные? Всегда ли в названии выполняется последовательность "вид производитель модель"?
2. Сколько данных нужно распарсить/на каком железе? возможно для ускорения понадобится оптимизация исполнение в несколько потоков
3. В каком виде нужен конечный результат (запись в бд, csv-файл, excel, другой формат)
---Ответы:---
1. Работал с регулярками еще до увлечения программированием, затем в c#, затем в python
2. 1000 р/час
3. Если задача затянется, могу потратить на от 2 до 4 ч в день
Распарсить заголовки товаров на Python
Реклама
Распарсить заголовки товаров на Python
Имеется большой массив названий товаров, как правило, включающий в себя вид товара, производителя, марку и прочую информацию.
Нужно написать скрипт на Python, который разбивает данные заголовки на составляющие, используя регулярные выражения и заранее подготовленные словари.
Например, заголовок «Наручные часы CASIO MTP-V004L-1B»
Разбиваются на:
Вид товара: наручные часы
Производитель: Casio
Модель: MTP-V004L-1B
В предложении, пожалуйста, укажите:
1. Работали ли вы ранее с регулярными выражениями на Python.
2. Какая стоимость вашей работы в час.
3. Сколько часов в день вы сможете уделить этой задаче в ближайшее время.
Спасибо.