Общее описание проекта

Требуется записать 1000 предложений, используя естественное чтение с чёткой дикцией и спокойной, нейтральной интонацией. Получившийся аудиодатасет будет использован для тренировки модели синтеза речи.

Требования к диктору

  • Приятный, мягкий, «милый» тембр голоса
  • Чёткое произношение без «каши во рту»
  • Нейтрально-спокойный темп речи, без излишней актёрской окраски

Условия записи - Окружение

  • Тихий, хорошо изолированный от шумов кабинет/комната
  • Отсутствие щелчков, клавиатуры, реверберации, уличного фона, мыши, дыхания в микрофон
  • Допускатся умеренная обработка (нормализация, подавление постоянного фона шумов), главное - чистота и естественность

Формат файлов на выходе

  • WAV / PCM
  • 44,1 кГц, 16 бит
  • Mono (один канал)
  • Мелкие естественные завершения слов приветствуются (паузы) - но перенасыщение речи шипением /смачноступ возбраняется

После предварительного брифа моей дальнейшей прослушке + сходятся требования - обеспечим к дистанкола бо прямо шина структуру мле