Описание задачи
Ищем специалиста по browser automation и web scraping с практическим опытом работы с крупными SEO SaaS-платформами, защищёнными современными анти-бот системами и Cloudflare. Необходимо реализовать стабильное автоматизированное извлечение данных через реальный браузер.
В рамках задачи требуется получать SEO-данные, доступные в интерфейсе после авторизации: анкоры, бэклинки, referring pages и другие связанные данные. Решение должно стабильно работать при высокой нагрузке (до ~10 000 доменов в день) и поддерживать параллельную обработку (concurrency) без блокировок и банов.
Общие требования
- Автоматизация реального браузера (headless или headful);
- Устойчивый обход Cloudflare и анти-бот защиты;
- Работа с авторизованными сессиями;
- Возможность автоматизации логина и 2FA (email или TOTP);
- Запуск в Docker-контейнере;
- Поддержка concurrency и контролируемого throughput;
- Чистый и поддерживаемый код (Python или Node.js).
Критерии отбора
Наличие PoC, демо или продакшн-опыта будет большим плюсом. После подтверждения релевантного опыта готовы предоставить полное техническое задание и рассмотреть долгосрочное сотрудничество.
В отклике желательно указать
- Опыт работы с подобными платформами;
- Используемые инструменты и подходы (Playwright, Puppeteer, CDP, stealth и т.п.);
- Наличие демо, PoC или примеров кода;
- Опыт работы с высокой нагрузкой и concurrency;
- Опыт автоматизации логина и 2FA.