Задача
Разработать алгоритм или ИИ-модуль для сопоставления (матчинга) номенклатуры парфюмерной продукции из нескольких прайс-листов поставщиков с товарами из основного (внутреннего) каталога. Данные содержат названия, артикулы, бренды, объемы и другие характеристики.
Требования
- Автоматическое распознавание одинаковых товаров, несмотря на различия в написании (опечатки, сокращения, разные языки, разный порядок слов).
- Поддержка форматов прайс-листов: XLSX, CSV, XML (при необходимости).
- Выдача результатов сопоставления в виде таблицы или JSON с указанием процента уверенности пары.
- Возможность ручной корректировки и дообучения на размеченных данных.
Важно
Конфиденциальность: из текста запроса удалены все реальные названия компаний, сайты и телефоны. Исполнитель обязан не копировать и не разглашать исходные данные заказчика.
Приветствуется решение на Python с библиотеками для NLP (пересечение, fuzzymatching, эмбеддинги) или использование внешних AI-сервисов (но с соблюдением безопасности).