Общая цель

Разработать скрипт на Python, работающий по расписанию на Linux/локальном ПК, который выполняет полный конвейер создания аудиконтента без участия человека.

Основные требования:

  • Ежедневный запуск в 18:00 по расписанию Linux (cron)
  • Парсинг нескольких указанных сайтов для сбора нового текстового контента
  • Создание структурированного сценария на основе заданного промпта с помощью локальной открытой LLM-модели (размером ~20B параметров)
  • Передача сценария в локальную TTS-систему для генерации качественного WAV-файла
  • Обязательная постобработка аудио: нормализация громкости, стабилизация динамического диапазона (компрессия/лимитирование)
  • Сохранение итогового файлов в указанную локальную папку на сервере или ОС
  • Ежедневная двукратная прогонка конвейера для двух разных источников (с возможностью масштабирования на большее количество сайтов)

Технические уточнения:

  • Все модели развернуты строго локально, никаких облачных API
  • TTS-движок установлен локально на компьютере
  • Языковая модель доступна через REST-интерфейс (draft: l-Studio) или через библиотеку трансформеров PyTorch/HuggingFace
  • Приветствуется минимальный веб-интерфейс для ручного запуска/конфигурации (Flask/Dash), но основная работа - через cron
  • Кроссплатформенность под Linux - обязательно, стандартный Python-стек бибилиотек

Формат результата:

  • Выходной файл - аудио WAV/MP3 со стабильной громкостью, готовый к воспроизведению
  • Система логирования и обработки ошибок в каждом модуле