Техническое задание: Автоматизация сбора данных с веб-сайта
Необходимо разработать скрипт для автоматизации рутинной задачи по сбору визуальных данных с веб-ресурса.
Основной функционал
- Чтение списка текстовых фраз из внешнего источника (например, текстового файла).
- Последовательный переход на целевой веб-сайт и автоматический ввод каждой фразы в поисковую строку (или соответствующее поле).
- Создание скриншота полной страницы с результатами после каждого ввода.
- Автоматическое сохранение каждого скриншота в формате PDF.
- Организация сохранённых PDF-файлов в заранее указанную папку на диске.
Ключевые требования
- Процесс должен быть полностью автоматизирован и выполняться без ручного вмешательства после запуска.
- Необходима устойчивость к возможным ошибкам загрузки страниц (таймауты, капчи и т.д.) с логированием проблем.
- Скрипт должен корректно обрабатывать весь список фраз от начала до конца.
- Имена итоговых PDF-файлов должны быть понятными, например, содержать исходную фразу или порядковый номер.
Ожидаемый результат
Готовое решение в виде исполняемого скрипта или программы, которое по запуску выполняет полный цикл операций и формирует папку с PDF-документами - скриншотами страниц для каждой фразы из списка.