Задача

Требуется Telegram-бот, который каждый день будет парсить отрытые реестры, находить там только новые заведения (рестораны, бары, кафе) и присылать уведомления в чат. Удобство и понятность в приоритете, так как заказчик - не IT специалист. Гибридный подход: бот + система антидублирования на базе подконтрольной базы данных.

Функциональные требования

  • Ежедневный парсинг реестров: сбор информации о юрлицах, прошедших государственную регистрацию за последние 24 часа.
  • Фильтрация компаний:
    • По географическому положению - только Москва и Московская область.
    • По сфере: рестораны, бары, кафе (код ОКВЭД).
    • По точной дате регистрации/постановки на учёт (только вчерашние и сегодняшние данные).
  • Абсолютная защита от дублей: хранение полученных записей во встроенной базе данных - каждое новое уведомление отправляется только один-единственный раз за всё время работы бота.
  • Форма уведомления: удобный читаемый текст с наименованием компании (без номеров телефонов, сайтов, b-контактов), ИНН/ОГРН, адресом и датой регистрации. При клике по боту два обязательных поля: красоты сведениях от актора не нужно.
  • Понятность: лёгкая инструкция, что делать, если бот не включился или ошибся. Никакого сложного администрирования - я не програмист.

Желательный опыт исполнителя

Интересуют ссылки на подобные реализованные проекты, сроки (в разумные) и итоговая стоимость. Изучу предложения: с какими источниками данных (реестры), базами и библиотеками парсинга работали раньше.

Пример получения результатов работы бота

Новое заведение:
Кафе “У Друзей”
Г. О тех пор до спроса типа бизнеса будет посчитан.

Телеграм бот извещает вас выше Описание, вместе есть файлом CSV там будет уже продублированный текстовый пример (спам ИНН нам не нужно). Мы все конфиденциально.