Техническое задание: Конвертер PDF в HTML с интеграцией
Краткое описание проекта
Существует система, состоящая из Telegram-бота, который генерирует отчеты в формате PDF. Эти отчеты необходимо автоматически конвертировать в HTML и публиковать в определенном разделе сайта.
Текущая ситуация и проблема
В настоящее время сгенерированные PDF-файлы отчетов сохраняются на сервере по пути, аналогичному: /report/номер_отчета/report.pdf. Основная задача - автоматизировать процесс преобразования этих PDF-файлов в корректно отображаемый HTML-код для их последующей публикации на веб-сайте.
Основные требования к решению
- Разработать скрипт или модуль для конвертации PDF-файлов в чистый и валидный HTML.
- Обеспечить корректное отображение текста, таблиц и базовой структуры документа после конвертации.
- Интегрировать решение в существующий процесс работы бота и сайта.
- Обеспечить автоматическую загрузку сконвертированного HTML-контента в заданный каталог на сайте.
- Учесть необходимость обработки файлов с динамически меняющимися номерами отчетов в путях.
Технические пожелания
- Решение должно быть надежным и работать без постоянного ручного вмешательства.
- Желательна возможность запуска конвертации по событию (например, после генерации нового отчета ботом).
- Код должен быть документирован и легко поддерживаем.