Задача
Необходимо написать скрипт, который обойдет все кликабельные названия коллекций на странице коллекций одного из интернет-магазинов обоев, последовательно раскроет (прожмет) каждую коллекцию, извлечёт название и проверит качество контента, который отображается после раскрытия.
Условия для отбраковки коллекций
Результат (название коллекции) заносится в итоговую таблицу только если контент под ней соответствует всем трём пунктам:
- Текст под коллекцией присутствует (не пустое описание).
- Под коллекцией отображаются сами товары (то есть коллекция содержит хотя бы один товар).
- Текст описания отформатирован нормально - не сплошная жирная заливка, не мелкий шрифт и не имеет других визуальных аномалий (кривое расположение, ошибки типографики).
По каждому случаю, когда хотя бы одно из условий нарушено, никакой записи в таблицу не добавляется (но последовательный сбор данных продолжается).
Результат работы
- Итоговая таблица в формате Excel/CSV с единственным столбцем: название коллекции.
- В таблицу попадают только «проверенные» коллекции, соответствующие всем трём условиям.
Дедлайн и приоритет
Работа может быть выполнена в течение недели (желательный срок готовности - к началу января 2026 года). Перегрузки по времени нет.