Техническое задание: Анализ и сравнение данных из PDF-документов
Цель проекта
Создать инструмент для автоматического сравнения содержимого двух PDF-файлов с последующей категоризацией и экспортом результатов.
Основные функциональные требования
- Загрузка и обработка двух PDF-файлов для сравнения
- Выявление и извлечение данных, присутствующих только в первом файле
- Выявление и извлечение данных, присутствующих только во втором файле
- Выявление данных, которые есть в обоих файлах
- Сохранение результатов сравнения в отдельные файлы или таблицы
Требования к результату
- Файл 1: Содержит записи, уникальные для первого исходного документа. Каждая запись должна быть помечена указанием на источник (название файла).
- Файл 2: Содержит записи, уникальные для второго исходного документа. Каждая запись должна быть помечена указанием на источник (название файла).
- Файл 3: Содержит общие для обоих исходных документов записи.
- Формат выходных данных: таблица (например, CSV, Excel) или структурированный текстовый файл.
Критерии успешного выполнения
- Корректность сравнения данных без потери информации
- Четкое разделение результатов на три логические группы
- Читаемый и структурированный формат итоговых файлов