Техническое задание: Сбор и структурирование данных поставщиков
Требуется автоматизировать сбор информации с веб-ресурса, являющегося каталогом участников выставки.
Основные задачи
- Обработать примерно 300 страниц каталога, начиная с указанного URL.
- Для каждой компании-участника извлечь следующие данные:
- Наименование поставщика
- Фотографию или логотип
- Текстовое описание деятельности
- Контактный email
- Официальный сайт
- Контактный телефон
- Провести верификацию собранных данных на корректность и полноту.
- Выгрузить итоговый набор данных в файл формата Excel с четкой структурой столбцов.
Требования к результату
- Данные должны быть чистыми, без дубликатов и с минимальным количеством ошибок парсинга.
- Excel-файл должен иметь логичную структуру, где каждая строка соответствует одному поставщику, а столбцы - типам извлеченных данных.