Описание задачи

Требуется доработать архитектуру Telegram-бота на платформе n8n, который использует языковую модель Gemini и векторную базу данных для хранения контекста. Цель - реализовать принудительное и гибкое использование RAG до отправки запроса к модели.

Ключевые требования

  • Обеспечить загрузку контекста из векторной БД до вызова LLM.
  • Реализовать механизм принудительного присоединения релевантных документов к каждому запросу.
  • Сделать поведение RAG гибким и настраиваемым (выбор правил, тегов, порогов сходства и т. п.).
  • Сохранить текущую архитектуру на n8n и принципы интеграции с внешними сервисами (векторная БД, Telegram, Gemini).

Текущий стек

  • n8n (оркестрация и автоматизация)
  • Gemini API / модель генерации
  • Векторная база данных (PostgreSQL с вектором / Supabase)

Ожидаемые доработки (подробно исполнителю)

  • Добавить модуль отбора контекста из хранилища на основе входящего сообщения.
  • Организовать принудительное включение найденных фрагментов до отправки промпта.
  • Дать пользователю/администратору механизмы управления тем, какие записи и как дополняются ответы.
  • Протестировать корректность работы инференса при разных показателях релевантности (например, k, threshold).

Исполнитель должен обладать опытом работы с платформой n8n, интеграцией внешних LLM и векторными базами данных. Важно предоставить документацию и мини-логику переключения режимов контекста.