Техническое задание: Парсинг данных продавцов маркетплейса
Требуется разработать решение для автоматизированного сбора информации о продавцах на крупном маркетплейсе. Общее количество продавцов для обработки - около 8000.
Цель проекта
Создать структурированную базу данных продавцов для дальнейшего анализа.
Источники данных
- Страница конкретного продавца (пример структуры URL будет предоставлен).
- Страницы категорий товаров для поиска и идентификации продавцов.
Извлекаемые данные (поля для Excel)
- Название магазина.
- Контактные телефоны (до 3 номеров).
- Количество товаров в ассортименте.
- Общее количество продаж магазина.
- Количество оценок и отзывов.
- Дата регистрации магазина.
- Процент успешно завершенных заказов.
- Рейтинг продавца.
- Метки магазина (например, «Надежный продавец»).
- Основная категория товаров (для понимания специализации).
- Дата сбора информации.
- URL-адрес страницы магазина.
Требования к результату
- Данные должны быть сохранены в файле формата Excel (.xlsx).
- Каждый продавец - отдельная строка, каждый параметр - отдельная колонка.
- Решение должно быть стабильным и обрабатывать большое количество страниц.
Технические детали
Исполнителю необходимо будет работать с веб-страницами, извлекать и очищать данные. Важно предусмотреть обработку ошибок и пропусков в данных.