Задача
Разработать парсер для поиска и сбора данных из отраслевого каталога предприятий.
Требования к работе
- Прокси: Парсер должен поддерживать подключение через прокси-сервер, настройка которого должна быть доступна в интерфейсе (например, в виде поля для ввода).
- Выбор категории: Каждая категория в каталоге имеет свой уникальный URL. Парсер должен позволять пользователю указать рабочую ссылку на нужную категорию.
- Фильтрация: Из выбранной категории необходимо отобрать только те компании, которые одновременно соответствуют следующим условиям:
- Должность руководителя (владельца компании):
Owner, President или Principal. - Годовой доход от 100 000 до 1 000 000 USD.
- Дата основания компании: не ранее 2023 года.
Результат
Парсер должен собирать и сохранять прямые ссылки на страницы найденных компаний. Сохранение производится в таблицу (например, Excel или CSV) или в обычный текстовый файл со ссылками.
Примечание
В ответе не следует указывать названия компаний, их сайты или номера телефонов.