Техническое задание: Автоматизация загрузки технической документации
Цель проекта
Разработать и интегрировать модуль для автоматического поиска, парсинга и прикрепления технической документации к карточкам промышленного оборудования на сайте. Это позволит повысить информативность товарных карточек, улучшить пользовательский опыт и увеличить конверсию.
Текущая ситуация
- Платформа: Существующий сайт на чистом PHP.
- Предметная область: Продажа промышленного оборудования (станков).
- Типовая карточка товара: Содержит базовые поля: наименование, модель, производитель, год выпуска и другие характеристики.
- Объем работ: Ежедневно добавляется до 50 новых товарных позиций.
- Текущий процесс: Документация добавляется вручную или отсутствует, что требует автоматизации.
Функциональные требования к модулю
1. Автоматический поиск документов
- Поиск должен осуществляться по открытым источникам в интернете.
- Основной источник: Поисковая система Яндекс.
- Целевые ресурсы: Сайты производителей, архивные порталы, тематические форумы, файлообменники, специализированные базы документации.
- Поисковый запрос должен формироваться автоматически на основе данных из карточки товара (наименование, модель, производитель).
2. Типы искомой документации
Модуль должен искать и загружать следующие виды файлов:
- Инструкции по эксплуатации
- Паспорта и технические паспорта
- Электрические и кинематические схемы
- Каталоги запчастей
- Руководства пользователя и наладчика
3. Парсинг и загрузка
- Автоматическое скачивание найденных документов (PDF, DOC, DJVU и другие распространенные форматы).
- Парсинг страниц для извлечения прямых ссылок на файлы.
- Фильтрация результатов по релевантности (приоритет - официальные источники).
- Интеграция с административной панелью сайта для отображения статуса и загруженных файлов.
4. Интеграция
- Беспроблемная интеграция с существующей PHP-структурой сайта.
- Модуль должен работать в фоновом режиме или по расписанию для обработки новых товаров.
- Реализация механизма привязки скачанного файла к конкретной карточке товара в базе данных.
Технические требования
- Язык реализации: Python (предпочтительно для парсинга) с обеспечением взаимодействия с PHP-системой.
- Устойчивость к изменениям структуры сторонних сайтов (использование надежных методов парсинга).
- Обработка ошибок и логирование процесса поиска и загрузки.
- Настройка задержек между запросами для соблюдения правил поисковых систем и сайтов.