Разработка ML-ядра для адаптивного тренажёра по обществознанию

Цель проекта

Создать лёгкое ML-ядро для онлайн-тренажёра, предназначенного для подготовки учеников 9-11 классов к олимпиадам по обществознанию. Система должна обеспечивать персонализированный учебный процесс с адаптивным подбором заданий.

Ключевые функциональные требования

1. Автоматическая оценка ответов

Оценивать ответы по шкале от 0 до 10.
Поддерживаемые форматы: тесты с выбором варианта, краткие ответы, развёрнутые ответы и эссе.

2. Генерация обратной связи и рекомендаций

Для тестов: объяснение правильного ответа и разбор ошибок.
Для текстовых ответов: анализ по ключевым пунктам, рекомендации по темам для изучения.
Возможность предоставления ссылок на учебную литературу через простую RAG-схему (Retrieval-Augmented Generation).

3. Управление знаниями и адаптация

Поддержка "карты знаний" по основным блокам: экономика, политика, право, социальные отношения, человек и общество.
Выявление слабых тем ученика на основе его ответов.
Адаптивная логика подбора следующего задания:
- Уровень сложности (skill_level) от 1 до 10.
- Правила для повышения или понижения уровня сложности.
- Периодическое возвращение к базовым задачам для закрепления материала.

4. Работа с данными и метрики

Подготовка формата таблиц для экспертной разметки "золотых данных".
Оценка необходимого объёма размеченных данных (ориентировочно 200-300 ответов).
Внедрение базовых метрик для оценки качества работы системы: MAE (средняя абсолютная ошибка), RMSE (среднеквадратичная ошибка), коэффициент каппа Коэна.
Настройка логирования работы системы.

Технические требования и ограничения

Архитектура: Лёгкая прослойка (middleware) вокруг внешней Large Language Model (LLM).
Модель: Использование внешней LLM уровня GPT-4o-mini или аналога с качественной поддержкой русского языка.
Подход: Акцент на rule-based (правила) и статистические решения. Обучение собственных сложных нейросетевых моделей не требуется.
Стек технологий:
- Бэкенд: Python + FastAPI или Flask.
- Поиск/база данных: простая векторная БД для реализации RAG.
Бюджет: 100 000 рублей.
Срок выполнения: До 3 месяцев.

Результат работы

Готовое ML-ядро, интегрируемое в основную платформу тренажёра, которое способно автоматически оценивать ответы, предоставлять содержательную обратную связь, отслеживать прогресс ученика и адаптивно формировать индивидуальную учебную траекторию.

общая