Техническое задание: Парсинг данных с сайта патентов
Необходимо автоматизировать сбор информации с веб-ресурса, содержащего базу патентных документов.
Основные требования
- Объект парсинга: сайт с патентной документацией (структура страниц аналогична примеру).
- Объем работы: необходимо обработать примерно 3000 отдельных страниц.
- Результат: собранные структурированные данные со всех целевых страниц.
- Каждая страница должна быть обработана полностью, извлечена вся представленная на ней информация.
Ожидаемый результат
На выходе должен быть получен полный датасет, соответствующий объему в 3000 документов, готовый для дальнейшего анализа или использования.