Необходимо обработать PDF-файлы и перенести данные в Excel
На основе XML-скриншота с образцами таблиц (графы колонок) и 64 входящих + 33 исходящих инвойсов (все файлы лежат по предоставленной ссылке), нужно извлечь и структурировать все строчные позиции в Excel.
- Из каждого файла нужно взять основные данные (номер, дата, поставщик/покупатель) - их записать на каждую строку однотипно.
- Каждая позиция накладной (название, количество, цена, сумма по строке) переносится в отдельную строку Excel с повторением блока информации о документе.
- Ссылка на полные PDF и образец выходной таблицы предоставляется отдельно, а порядок колонок и формат задаётся образцом-шаблоном конечного EXCEL-файла (шаблон приложен к заданию).
- Упоминания конкретной компании, номера телефонов и URL в этом материале должны быть исключены или заменены.
Требования к выполнению
- Использовать данные ТОЛЬКО из имен директорий IN (входящие) и OUT (исходящие)
- Не допускается пропуск и слияние строчечных позиций
- Формулы, макросы, скрипты не требуются - выгружается просто структурированная статика в XLSX-файл полностью по PDF
Извлечение можно сделать как вручную, так и автоматизировать через Excel или по подготовленному скрипту. Общая маска структуры таблицы прозрачна и основана на практическом копировании каждого отдельного I`tog факс-терм-контентой сделки из распечатанной версии инвойса.