Техническое задание: Настройка и интеграция сервиса распознавания речи
Цель проекта
Создать готовое рабочее окружение для преобразования аудиозаписей в текст. Пользователь должен иметь возможность вручную загружать MP3-файлы и получать их точные текстовые расшифровки. Ключевая часть работы - обучение заказчика самостоятельной работе с системой.
Исходные данные и контекст
- Источник данных: ручная загрузка аудиофайлов в формате MP3.
- Основной инструмент: облачный сервис распознавания речи.
- Требуется освоить два режима работы сервиса: стандартный асинхронный и отложенный асинхронный (экономичный).
Требования к функционалу
Основная настройка
- Развернуть и настроить среду для взаимодействия с API сервиса распознавания речи.
- Реализовать механизм ручной загрузки MP3-файлов для обработки.
- Обеспечить стабильное получение и сохранение текстовых расшифровок.
Поддержка режимов обработки
- Интегрировать работу через обычную асинхронную транскрибацию (стандартная скорость и стоимость).
- Интегрировать работу через отложенную асинхронную транскрибацию (увеличенное время обработки, сниженная стоимость).
- Система должна четко разделять эти два процесса.
Обучение и передача знаний
Практический инструктаж
- Провести подробное обучение пользователя: процесс загрузки файлов, выбор типа обработки, получение результатов.
- Наглядно продемонстрировать разницу между обычной и отложенной обработкой (сроки, экономия).
- Ответить на все вопросы по работе с настроенным окружением.
Документация
- Предоставить пользователю понятную, пошаговую инструкцию для самостоятельной работы после завершения настройки.
- Инструкция должна охватывать все базовые операции.
Ожидаемые результаты
- Полностью настроенная и работоспособная среда для распознавания речи.
- Обученный пользователь, способный самостоятельно загружать файлы и запускать оба типа транскрибации.
- Исчерпывающая письменная инструкция по эксплуатации системы.