Разработка ML-ядра для адаптивного тренажёра по обществознанию

Цель проекта

Создать лёгкое ML-ядро для онлайн-тренажёра, предназначенного для подготовки учеников 9-11 классов к олимпиадам по обществознанию. Система должна обеспечивать персонализированный учебный процесс с адаптивным подбором заданий.

Ключевые функциональные требования

1. Автоматическая оценка ответов

  • Оценивать ответы по шкале от 0 до 10.
  • Поддерживаемые форматы: тесты с выбором варианта, краткие ответы, развёрнутые ответы и эссе.

2. Генерация обратной связи и рекомендаций

  • Для тестов: объяснение правильного ответа и разбор ошибок.
  • Для текстовых ответов: анализ по ключевым пунктам, рекомендации по темам для изучения.
  • Возможность предоставления ссылок на учебную литературу через простую RAG-схему (Retrieval-Augmented Generation).

3. Управление знаниями и адаптация

  • Поддержка "карты знаний" по основным блокам: экономика, политика, право, социальные отношения, человек и общество.
  • Выявление слабых тем ученика на основе его ответов.
  • Адаптивная логика подбора следующего задания:
    • Уровень сложности (skill_level) от 1 до 10.
    • Правила для повышения или понижения уровня сложности.
    • Периодическое возвращение к базовым задачам для закрепления материала.

4. Работа с данными и метрики

  • Подготовка формата таблиц для экспертной разметки "золотых данных".
  • Оценка необходимого объёма размеченных данных (ориентировочно 200-300 ответов).
  • Внедрение базовых метрик для оценки качества работы системы: MAE (средняя абсолютная ошибка), RMSE (среднеквадратичная ошибка), коэффициент каппа Коэна.
  • Настройка логирования работы системы.

Технические требования и ограничения

  • Архитектура: Лёгкая прослойка (middleware) вокруг внешней Large Language Model (LLM).
  • Модель: Использование внешней LLM уровня GPT-4o-mini или аналога с качественной поддержкой русского языка.
  • Подход: Акцент на rule-based (правила) и статистические решения. Обучение собственных сложных нейросетевых моделей не требуется.
  • Стек технологий:
    • Бэкенд: Python + FastAPI или Flask.
    • Поиск/база данных: простая векторная БД для реализации RAG.
  • Бюджет: 100 000 рублей.
  • Срок выполнения: До 3 месяцев.

Результат работы

Готовое ML-ядро, интегрируемое в основную платформу тренажёра, которое способно автоматически оценивать ответы, предоставлять содержательную обратную связь, отслеживать прогресс ученика и адаптивно формировать индивидуальную учебную траекторию.