Техническое задание: Разработка голосового бота для RAG-системы
Цель проекта
Интегрировать голосовой интерфейс в существующую RAG (Retrieval-Augmented Generation) систему. Пользователь должен иметь возможность взаимодействовать с системой с помощью голоса: задавать вопросы и получать релевантные ответы из базы знаний в аудиоформате.
Основные требования
- Разработка голосового бота, выступающего в качестве фронтенда для готовой RAG-системы.
- Реализация функций:
- Запись и распознавание голосовых запросов пользователя (Speech-to-Text).
- Передача текстового запроса в RAG-систему для обработки.
- Получение текстового ответа от системы и его преобразование в естественную голосовую речь (Text-to-Speech).
- Обеспечение плавного диалогового взаимодействия.
- Бот должен быть отзывчивым, с минимальной задержкой между запросом и ответом.
- Архитектура решения должна позволять легко интегрироваться с существующим бэкендом RAG.
- Необходимо предусмотреть базовую обработку ошибок (проблемы со связью, нераспознанная речь, отсутствие ответа от системы).
Ожидаемый результат
Работоспособный голосовой бот, который принимает устные вопросы, использует RAG-систему для поиска точных ответов в документах и озвучивает найденную информацию пользователю.