Техническое задание: Парсинг и структурирование каталога товаров
Основная цель
Автоматизировать сбор полной информации из каталога товаров целевого сайта, включая текстовые данные и файлы, с последующей организацией в удобную для работы структуру.
Ключевые требования
1. Сбор данных
- Необходимо выполнить парсинг всех товаров из каталога сайта.
- Извлечь все доступные данные по каждой позиции (название, характеристики, описание и т.д.).
2. Формат результата
- Собранные данные должны быть сохранены в единую таблицу формата Excel (.xlsx).
- Таблица должна быть структурирована и удобна для чтения.
3. Скачивание файлов
- Для каждой карточки товара необходимо скачать все прикрепленные PDF-файлы (документация, сертификаты, инструкции).
4. Организация файлов и папок
- Создать иерархическую систему папок, которая в точности повторяет структуру категорий каталога на сайте (например, Главная категория -> Подкатегория -> Группа товаров -> Тип товара).
- В каждой конечной папке, соответствующей товару, должны находиться все скачанные для него PDF-файлы.
Итоговый результат
Исполнитель предоставляет:
- Excel-файл с полным каталогом товаров.
- Директорию с вложенной структурой папок, содержащую все загруженные файлы, организованные по категориям сайта.