Техническое задание: Интеграция OCR и GPT-4o для образовательного бота

Суть проекта

Существует рабочая версия Telegram-бота для образовательного проекта. Требуется модернизировать его серверную часть, заменив текущий механизм анализа изображений.

Основные задачи

  • Настроить сервер на Linux (VPS).
  • Разработать скрипт или API для обработки фотографий, поступающих из Telegram-бота.
  • Реализовать распознавание текста на русском языке как рукописного, так и печатного с использованием библиотеки PaddleOCR.
  • Настроить отправку распознанного текста в модель OpenAI GPT-4o через API.
  • Организовать получение ответа от модели (анализ, выявление ошибок, пояснения) и его возврат пользователю в Telegram.

Технологический стек

  • Язык программирования: Python.
  • OCR: PaddleOCR.
  • Анализ текста: OpenAI API (GPT-4o).
  • Платформа: Linux VPS.
  • Интеграция с Telegram Bot API.

Ожидаемые результаты

  • Настроенный и работающий сервер.
  • Установленный и протестированный PaddleOCR.
  • Рабочий скрипт или API-эндпоинт для обработки изображений.
  • Подробная инструкция по запуску и поддержке системы.
  • Тестовый пример работы всей цепочки через Telegram-бота.

Дополнительные пожелания

Приветствуется опыт работы с OCR-системами и наличие портфолио с похожими проектами. Проект рассчитан на длительное сотрудничество с возможностью дальнейшей технической поддержки.

Срок выполнения: 5-7 дней

Разработка Telegram-бота с функционалом AI-агента

Требуется создать Telegram-бота, который через API будет воспроизводить полный функционал современного AI-агента. Бот должен работать в мессенджере и обладать интеллектуальными возможностями для обработки запросов.

Автоматизация скачивания PDF-документов с сайта

Требуется найти или создать удобный способ массового скачивания PDF-файлов, который исключит ручную обработку каждой страницы. Документы могут содержать сотни страниц, что делает текущий метод неэффективным.