Разработка Backend-системы для сбора и аналитики больших данных с автомобильных площадок

Цель проекта - создание отказоустойчивого ETL-конвейера и хранилища данных (DWH) уровня крупных агрегаторов объявлений.

Основные задачи

  • Высоконагруженный парсинг: Ежедневный сбор миллионов объявлений с автомобильных классифайдов. Требуется опыт работы с современными системами защиты (Cloudflare, Datadome, капчи).
  • Очистка и нормализация: Приведение неструктурированных данных к единому формату.
  • Алгоритм «Золотой записи»: Реализация механизма склейки дублирующихся объявлений с разных источников с использованием Fuzzy Matching.
  • Проектирование и наполнение DWH: Создание схемы хранилища данных для последующей аналитики.

Стек технологий (строго)

  • Язык и фреймворки: Python (Asyncio, Aiohttp, Playwright).
  • Базы данных: ClickHouse (для аналитики) и PostgreSQL (для метаданных).
  • Оркестрация: Apache Airflow.
  • Инфраструктура: Docker.

Требования к исполнителю

  • Опыт в high-load скрапинге: понимание ротации прокси, работы с TLS-fingerprinting и обхода антибот-систем.
  • Умение проектировать эффективные схемы хранилищ данных (DWH).
  • Готовность следовать подробному техническому заданию и согласованному техпроцессу.
  • Ответственный подход к работе с большими объемами данных.

Миграция сайта с CMS на новый сервер Rocky Linux 9

Требуется перенести сайт доски объявлений с сервера CentOS 7 на новый сервер под управлением Rocky Linux 9. Необходимо обновить стек технологий (PHP, MySQL) и обеспечить корректную работу самописной CMS.

Разработка Telegram-бота с проверкой подписки и пароля для выдачи ссылок

Требуется создать Telegram-бота, который будет предоставлять пользователям доступ к защищенным материалам после проверки двух условий: подписки на указанный канал и ввода секретного слова. Бот должен иметь интуитивный интерфейс с кнопками, быть развернут на бесплатном хостинге и оптимизирован для высокой нагрузки.