Концепция проекта

Мы ищем специалиста или команду для разработки real-time AI-аватара на основе данных конкретного человека. Пользователь заходит на сайт, нажимает кнопку «начать диалог» и вступает в живой голосовой разговор с фотореалистичным 2D-изображением (лицо и плечи), которое отвечает голосом и видео в реальном времени. Это не предзаписанные клипы и не текстовый чат-бот, а полноценная интерактивная сессия с минимальной задержкой, сохраняющая стиль речи и логику оригинального человека.

Входные данные

  • Видео- и аудиозаписи интервью с человеком-прототипом
  • Транскрипции этих интервью
  • Утвержденный набор формулировок и ограничений по темам (guardrails)

Ключевые требования (MVP)

  • Язык: русский
  • Голос: точный клон (синтез) голоса реального человека
  • Визуал: фотореалистичный 2D talking head (голова + плечи)
  • Режим работы: real-time без предварительной генерации (inference на лету)
  • Задержка: минимально возможная, комфортная для естественного диалога
  • Нагрузка: одновременная работа для одного пользователя
  • Длительность сессии: от 15 до 60 минут
  • Размещение: стандартный веб-сайт

Функциональность минимального продукта (MVP)

  • Пользовательский интерфейс: сайт с кнопкой «начать диалог»
  • Голосовой ввод (захват через микрофон)
  • Вывод голосового и видеосигнала аватара
  • Модерация тем (Guardrails)
  • Таймер, ограничивающий продолжительность сессии
  • Логирование всех диалогов для анализа

Что не требуется

  • 3D-модель персонажа в полный рост
  • Решения на базе Unreal Engine или в метавселенных
  • Обработка массовой нагрузки (highload)
  • Интеграция с NFT или блокчейном