Разработка ML-ядра для адаптивного тренажёра по обществознанию

Цель проекта

Создать лёгкое ML-ядро для онлайн-тренажёра, предназначенного для подготовки учеников 9-11 классов к олимпиадам по обществознанию. Система должна обеспечивать персонализированный учебный процесс с адаптивным подбором заданий.

Ключевые функциональные требования

1. Автоматическая оценка ответов

  • Оценивать ответы по шкале от 0 до 10.
  • Поддерживаемые форматы: тесты с выбором варианта, краткие ответы, развёрнутые ответы и эссе.

2. Генерация обратной связи и рекомендаций

  • Для тестов: объяснение правильного ответа и разбор ошибок.
  • Для текстовых ответов: анализ по ключевым пунктам, рекомендации по темам для изучения.
  • Возможность предоставления ссылок на учебную литературу через простую RAG-схему (Retrieval-Augmented Generation).

3. Управление знаниями и адаптация

  • Поддержка "карты знаний" по основным блокам: экономика, политика, право, социальные отношения, человек и общество.
  • Выявление слабых тем ученика на основе его ответов.
  • Адаптивная логика подбора следующего задания:
    • Уровень сложности (skill_level) от 1 до 10.
    • Правила для повышения или понижения уровня сложности.
    • Периодическое возвращение к базовым задачам для закрепления материала.

4. Работа с данными и метрики

  • Подготовка формата таблиц для экспертной разметки "золотых данных".
  • Оценка необходимого объёма размеченных данных (ориентировочно 200-300 ответов).
  • Внедрение базовых метрик для оценки качества работы системы: MAE (средняя абсолютная ошибка), RMSE (среднеквадратичная ошибка), коэффициент каппа Коэна.
  • Настройка логирования работы системы.

Технические требования и ограничения

  • Архитектура: Лёгкая прослойка (middleware) вокруг внешней Large Language Model (LLM).
  • Модель: Использование внешней LLM уровня GPT-4o-mini или аналога с качественной поддержкой русского языка.
  • Подход: Акцент на rule-based (правила) и статистические решения. Обучение собственных сложных нейросетевых моделей не требуется.
  • Стек технологий:
    • Бэкенд: Python + FastAPI или Flask.
    • Поиск/база данных: простая векторная БД для реализации RAG.
  • Бюджет: 100 000 рублей.
  • Срок выполнения: До 3 месяцев.

Результат работы

Готовое ML-ядро, интегрируемое в основную платформу тренажёра, которое способно автоматически оценивать ответы, предоставлять содержательную обратную связь, отслеживать прогресс ученика и адаптивно формировать индивидуальную учебную траекторию.

Разработка полного комплекта проектной документации на производственное помещение

Требуется подготовить полный комплект проектной документации для производственного помещения площадью 1500 кв.м. по всем необходимым разделам. Задача включает в себя систематизацию и оформление всех технических и архитектурных решений.