Техническое задание: Доработка алгоритма PPO

Необходимо выполнить анализ и улучшение кода, реализующего алгоритм обучения с подкреплением Proximal Policy Optimization (PPO).

Исходные материалы

Исходный код проекта размещен в репозитории.
В архиве с проектом также находится научная статья, описывающая теоретические основы и детали реализации.

Основные задачи

Изучить предоставленный исходный код и сопутствующую документацию.
Проанализировать реализацию на предмет соответствия алгоритму PPO.
Предложить и внести улучшения в код для повышения его эффективности, читаемости или производительности.
Обеспечить понятность и чистоту итогового кода.

Требования к исполнителю

Опыт работы с фреймворками для машинного обучения (например, PyTorch, TensorFlow).
Глубокое понимание алгоритмов обучения с подкреплением, в частности PPO.
Умение работать с чужим кодом и технической документацией.

дизайн

Создание минутной детской анимации на тему взаимопомощи

Требуется аниматор для создания минутного мультфильма для детей от 6 лет на тему взаимопомощи в подводном мире. Есть раскадровка, озвучка и концепт-арты. Дедлайн - до 21 числа.

дизайн

Дизайн и допечатная подготовка этикетки для детского набора

Требуется сверстать макет обёртки для картонной коробки детского набора по предоставленному референсу. Необходимо адаптировать дизайн под русский язык, заменить цвета согласно бренд-букву и подготовить файлы к печати.

копирайтинг

Написание музыкального пресс-релиза и слоганов для трека

Требуется создать краткий продающий пресс-релиз для музыкального трека и несколько слоганов для таргетированной рекламы. Необходимо раскрыть идею трека о земной и неземной любви.