Задача

Необходимо разработать скрипт для автоматического сопоставления (матчинга) товаров, которые указаны в различных прайс-листах. В условиях нет единых артикулов или ID, поэтому сравнение выполняется на основе текстового сходства названий.

Требования к функционалу

  • Скрипт должен загружать данные из нескольких прайс-листов (формат может быть уточнен с заказчиком: Excel, CSV, TXT).
  • Реализовать алгоритм нечёткого сравнения названий товаров (например, с использованием библиотек Levenshtein, fuzzywuzzy или аналогичных).
  • На выходе должен формироваться отчет или список с указанием пар «наиболее подходящих» товаров (с мерой схожести).
  • Важно учитывать возможные опечатки, различия в порядке слов, лишние символы в названиях.

Формат данных

Пример содержимого прайс-листов (названия компаний, телефоны и сайты скрыты):

  • Прайс-лист 1: Марка/Модель, Телефон, иное…
  • Прайс-лист 2: Наименование товара, дополнительная информация…

Точный формат столбцов и источники согласовываются с заказчиком после начала работы.

Результат

Файл или консольный вывод с парами товаров и коэффициентом совпадения. Допускается сохранение результатов в новый табличный документ или JSON.

Код будет написан на Python, без привязки к сторонним веб-сервисам.