Разработка ML-ядра для адаптивного тренажёра по обществознанию
Цель проекта
Создать лёгкое ML-ядро для онлайн-тренажёра, предназначенного для подготовки учеников 9-11 классов к олимпиадам по обществознанию. Система должна обеспечивать персонализированный учебный процесс с адаптивным подбором заданий.
Ключевые функциональные требования
1. Автоматическая оценка ответов
- Оценивать ответы по шкале от 0 до 10.
- Поддерживаемые форматы: тесты с выбором варианта, краткие ответы, развёрнутые ответы и эссе.
2. Генерация обратной связи и рекомендаций
- Для тестов: объяснение правильного ответа и разбор ошибок.
- Для текстовых ответов: анализ по ключевым пунктам, рекомендации по темам для изучения.
- Возможность предоставления ссылок на учебную литературу через простую RAG-схему (Retrieval-Augmented Generation).
3. Управление знаниями и адаптация
- Поддержка "карты знаний" по основным блокам: экономика, политика, право, социальные отношения, человек и общество.
- Выявление слабых тем ученика на основе его ответов.
- Адаптивная логика подбора следующего задания:
- Уровень сложности (skill_level) от 1 до 10.
- Правила для повышения или понижения уровня сложности.
- Периодическое возвращение к базовым задачам для закрепления материала.
4. Работа с данными и метрики
- Подготовка формата таблиц для экспертной разметки "золотых данных".
- Оценка необходимого объёма размеченных данных (ориентировочно 200-300 ответов).
- Внедрение базовых метрик для оценки качества работы системы: MAE (средняя абсолютная ошибка), RMSE (среднеквадратичная ошибка), коэффициент каппа Коэна.
- Настройка логирования работы системы.
Технические требования и ограничения
- Архитектура: Лёгкая прослойка (middleware) вокруг внешней Large Language Model (LLM).
- Модель: Использование внешней LLM уровня GPT-4o-mini или аналога с качественной поддержкой русского языка.
- Подход: Акцент на rule-based (правила) и статистические решения. Обучение собственных сложных нейросетевых моделей не требуется.
- Стек технологий:
- Бэкенд: Python + FastAPI или Flask.
- Поиск/база данных: простая векторная БД для реализации RAG.
- Бюджет: 100 000 рублей.
- Срок выполнения: До 3 месяцев.
Результат работы
Готовое ML-ядро, интегрируемое в основную платформу тренажёра, которое способно автоматически оценивать ответы, предоставлять содержательную обратную связь, отслеживать прогресс ученика и адаптивно формировать индивидуальную учебную траекторию.