Техническое задание: Разработка системы чтения по губам
Основная задача
Разработать программное обеспечение, способное анализировать видеофрагмент продолжительностью 3 минуты и преобразовывать движение губ говорящего человека в текстовую расшифровку.
Ключевые требования
- Обработка видеофайла стандартного формата (например, MP4, AVI).
- Длительность анализируемого видео - 3 минуты.
- Алгоритм должен фокусироваться на области лица и артикуляции губ.
- Обеспечение максимально возможной точности распознавания речи.
- Вывод итогового текста в удобном формате (текстовый файл или интерфейс программы).
- Решение должно быть готово к практическому использованию.
Ожидаемый результат
Готовая рабочая программа или скрипт, который принимает на вход видео и выдает текстовую расшифровку сказанного, полученную исключительно на основе визуального анализа.