Задача
Необходимо обработать выгрузку из 300 000 товаров (техническое оборудование: преобразователи частоты, насосы, шкафы управления и т.п.) из Excel-файла. Все товары требуется:
- Распределить по заранее предоставленному дереву категорий;
- Заполнить для каждой позиции характеристики строго по шаблону, уникальному для каждой категории;
- Написать описание по шаблону текста, также уникальному для каждой категории;
- Провести верификацию заполненных данных по источникам (проверить соответствие характеристик и описаний оригиналу).
Требования к выполнению
- Все контактные данные, названия фирм, сайты и телефоны из исходных файлов должны быть удалены или замаскированы;
- Формат итоговых данных - структурированная таблица (Excel или CSV) с колонками: категория, характеристики (поля из шаблона), описание;
- Необходимо обеспечить проверку совпадения характеристик с базой производителя или другими официальными источниками (допустимо верить логике, но подчеркнуть происхождение данных).
Важно
В работе не используются имена любых организаций, телефоны или URL. Любая упомянутая компания должна быть закодирована или заменена подстановочными именами. Финальная документация должна быть готова в структурированном виде, с пригодным для дальнейшего машинного парсинга форматом
: я даю пояснение - просто удалить контактные данные, не менять существенных инструкций по задаче сохранить визуал.