Цель проекта

Автоматизировать процесс разбора и анализа смет (в формате PDF с текстом). На основе загруженного документа ИИ должен распознать наименования оборудования и их количество, затем найти актуальные цены на пяти заранее выбранных сайтах и вывести итоговый отчет в Excel с усредненной ценой.

Основные функции сервиса

  • Прием на вход PDF-сметы (только с текстовым содержанием);
  • Автоматическое распознавание наименований и количества оборудования через API выбранного грамм‑образца (например, модели генеративного ИИ);
  • Поиск каждого наименования на пяти заранее заданных сайтах интернет-магазинов/каталогов (ссылки на утилиты типа Firecrawl приветствуются для ускорения);
  • Расчет усредненной цены на основе найденных данных;
  • Формирование и выгрузка Excel-файла с ‘таб.1 - Итоги’ (заголовки, количество, средняя цена, список найденных цен).

Технические требования

  • Разработка: веб-сервис, развертывается на моем сервере;
  • Паель с прокси для работы API LLM (необходимые ключи и прокси предоставлю);
  • Желательно упростить парсинг страниц через интеграцию с aimecrawl/Feeds шенталом (использование готовых решений приветствуется, например, firecrawl);
  • Автоматизация не требуется в режиме микро-шагов, достаточно одного запроса: «пришел файл ‑› результат в Excel».

Ожидаемый результат

Готовый веб‑сервис, который каждый раз при загрузке PDF:

  • распознаёт текст с помощью детали чернови да;
  • поиски выполяет в пане ок зме данные ;
  • выдаёт на страницах лички XLS-файл.