Задача

Развернуть открытый проект синтеза речи (репозиторий CosyVoice) на голой Ubuntu 24.04, предоставленной заказчиком - доступ root будет выдан. Дополнительно создать минимальный веб-интерфейс для демонстрации и тестирования функционала (TL/DR по проекту: генерирование голоса из текста/аудио).

Что требуется подготовить

  • полная установка и настройка зависимостей (Python, PyTorch, CUDA опционально);
  • запуск проекта с корректной инициализацией весов/алгоритмов;
  • создание простой веб-страницы (Flask/аналог) с полями ввода текста, кнопкой ‹Озвучить› и выводом аудио;
  • настройка автозагрузки и доступности по публичному IP/порту.

Результат

  • рабочий веб-интерфейс, доступный из браузера;
  • подробный README.md во встроенном или отдельном репозитории - пошаговая инструкция от чистой Ubuntu до запущенного сервиса (как для технаря, так и для начинающего).