Разработка скрипта для подготовки обучающих данных

Цель проекта

Создать инструмент для автоматической обработки неструктурированных текстовых данных и формирования готового датасета в формате CSV, который можно напрямую использовать для дообучения языковой модели.

Основные требования

  • Разработка Python-скрипта, принимающего на вход текстовые файлы с диалогами
  • Преобразование данных в структурированный CSV-файл с четко определенными колонками
  • Обеспечение корректного формата данных для последующего использования в тренировочных пайплайнах
  • Скрипт должен быть документирован и готов к интеграции в процесс обработки данных

Технические детали

Формат выходного файла должен соответствовать стандартам, принятым для обучения современных языковых моделей. Важно предусмотреть обработку различных сценариев входных данных и возможных ошибок формата.

Аранжировка и саунд-дизайн в стилях металкор, хэви-метал, ню-метал

Требуется саунд-дизайнер для создания аранжировки по референсу (перестучать минус) в жанрах металкора, электро-рока и ню-метала. Рассматриваю долгосрочное сотрудничество на несколько песен при успешном результате.

Разработка системы Telegram-ботов для автоматизации управления группами

Требуется создать систему из двух Telegram-ботов или одного бота с двумя режимами для автоматического создания групп, управления списками контактов и массового добавления участников. Задачи предполагают работу с большими объемами данных.