Разработка сервиса улучшения транскрипции с использованием LLM
Требуется создать инструмент для автоматического повышения качества текстовых расшифровок аудио и видеоматериалов.
Основная задача
Сервис должен принимать на вход сырой текст, сгенерированный любой системой распознавания речи (Speech-to-Text), и с помощью интеграции с крупной языковой моделью (LLM) выполнять его улучшение.
Ключевые функции
- Автоматическая обработка текста, полученного из аудио/видео.
- Исправление грамматических, пунктуационных и стилистических ошибок, характерных для машинной транскрипции.
- Улучшение структуры текста, разбивка на абзацы, приведение к читаемому формату.
- Возможность настройки степени и типа коррекции (например, только пунктуация или полная стилистическая правка).
- Обеспечение стабильной работы пайплайна: исходный текст → LLM → улучшенный текст.
Технические требования
- Интеграция с выбранной LLM (например, через API).
- Разработка backend-части сервиса для обработки запросов.
- Создание понятного интерфейса для отправки текста и получения результата (может быть API endpoint, простой веб-интерфейс или консольное приложение - по согласованию).
- Обработка ошибок и обеспечение отказоустойчивости при работе с внешними API.
Цель - получить инструмент, который превращает необработанную машинную транскрипцию в чистый, грамотный и удобочитаемый текст.