Техническое задание: Telegram-бот для обработки файлов
Цель проекта
Разработать функционального Telegram-бота, способного автоматически обрабатывать пользовательские файлы, извлекать из них структурированную текстовую информацию и предоставлять результат в удобном виде.
Основные функции бота
- Прием файлов от пользователей в форматах: PDF, Excel (XLS/XLSX), JPEG (и других распространенных графических форматов).
- Извлечение текста из загруженных файлов с фокусом на поиск специфических данных.
- Распознавание и парсинг списков материалов с указанием их объемов или количеств.
- Отправка обработанного текста (извлеченного списка) обратно пользователю в чат.
- Обработка ошибок (например, если файл не содержит нужных данных или имеет поврежденный формат).
Требования к реализации
- Бот должен быть написан на языке Python.
- Использование библиотеки python-telegram-bot или аналогичной для работы с Telegram API.
- Для обработки PDF-файлов потребуются библиотеки (например, PyPDF2, pdfplumber).
- Для работы с Excel-файлами - библиотеки (например, pandas, openpyxl).
- Для извлечения текста из изображений (JPEG) - использование OCR-библиотек (например, Tesseract с оберткой pytesseract).
- Код должен быть чистым, документированным и готовым к развертыванию.
Ожидаемый результат
Полностью рабочий Telegram-бот, размещенный на сервере, с понятным интерфейсом взаимодействия. Бот должен стабильно обрабатывать файлы указанных форматов и возвращать пользователю текстовые списки материалов.