Техническое задание: Парсинг контактов с веб-сайта

Цель проекта

Автоматизировать сбор и структурирование контактной информации с указанного веб-ресурса. Результатом должна стать готовая к использованию таблица данных.

Основные задачи

  • Разработать скрипт для обхода страниц целевого сайта.
  • Извлечь не менее 50 000 email-адресов (Gmail).
  • Для каждого адреса собрать и сопоставить связанные данные: название компании и номер телефона.
  • Структурировать полученные данные в единую таблицу (например, CSV или Excel).
  • Обеспечить корректную обработку пагинации на сайте.

Требования к результату

  • Финальный файл в табличном формате с колонками: "Название компании", "Телефон", "Email".
  • Данные должны быть чистыми и проверенными на валидность (особенно email-адреса).
  • Процесс сбора должен быть автоматизирован для работы с большим объемом страниц.

Технические примечания

Исполнителю будет предоставлен точный URL целевого ресурса для начала работы. Важно учитывать структуру сайта и возможные ограничения на частоту запросов.

Разработка Python-скрипта для автоматического сбора изображений с веб-сайта

Требуется создать скрипт на Python для автоматизации браузера и скачивания изображений с заданного веб-ресурса. Необходим опыт работы с библиотеками для автоматизации, такими как Selenium или Playwright.