Задача

Требуется создать Telegram-бота для автоматического парсинга информации с веб-сайта. Результаты работы бота должны сохраняться в табличных форматах (.xlsx, .csv, .json) для последующего анализа.

Основные требования

  • Язык реализации: Python
  • Библиотеки: aiogram для бота, requests/aiohttp для запросов, BeautifulSoup/lxml для парсинга
  • Возможность инициировать парсинг по команде от пользователя
  • Сбор всех определенных типов данных с целевого сайта
  • Сохранение результатов в совместимом формате

Алгоритм работы

Пользователь отправляет боту команду запуска, после чего происходит:

  1. Подключение к сайту через библиотеки HTTP запросов
  2. Изучение структуры HTML страниц
  3. Извлечение всех необходимых полей
  4. Формирование таблицы с данными
  5. Отправка готового файла пользователю

Пожелания по реализации

Бот должен корректно обрабатывать CAPTCHA или блокировки (если есть), использовать задержки между запросами для имитации поведения человека. Также приветствуется работа как с HTML, так и с динамически загружаемым контентом при необходимости.