Задача
Разработать ИИ-аватара, способного правдоподобно воспроизводить внешность, мимику и речь человека. Аватар должен интегрироваться в сценарий рекламного контента, снимаемого в обстановке торгового зала.
Требования
- Визуализация: кинематографическая реалистичность, синхронизация движений губ с речью
- Озвучка: чистый синтезированный русский язык с естественной интонацией
- Обучение модели: на основе видеоматериалов и аудиозаписей реального человека
- Формат итогового видео: Full HD, прозрачный фон или готовые ролики до 60 секунд
- Совместимость: возможность использования типовых фоновых видео с пространством магазина
Описание процесса
Обучение аватара проходит на эталонных записях дикции, эмоций и поз. После обучения аватар может работать по подготовленным сценариям, вставляться в любое магазинное окружение (заморозка данного этапа). На проекте должны быть предусмотрены итерации с заказчиком для доведения «живости» аватара до 98% совпадения с оригиналом.
Инструменты
Желательно использование нейросетей последнего поколения - Wave2Lip, SadTalker, DeepFaceLab или аналогов для видеоартефактов. Конечный вариант должен рендериться на стандартном геймер-ПК без облачных майнфреймов.