Задача
Необходимо создать программу, которая автоматически обрабатывает PDF-документы, извлекает ключевые атрибуты (номер документа, тип, заголовок, дату) и записывает их в заданную таблицу базы данных Microsoft Access.
Требования к функциональности
- Программа должна работать с папкой, содержащей множество PDF-файлов (либо получать список файлов).
- Извлечение атрибутов должно выполняться корректно из текстового содержимого PDF (возможно, потребуется парсинг метаданных или текста).
- Сохранение данных производится в указанную таблицу базы данных MS Access (формат .accdb или .mdb).
- Интерфейс программы может быть консольным, но требуется обеспечить стабильность работы и обработку ошибок (например, защита от нечитаемых или повреждённых файлов).
Дополнительные условия
- Разработка может вестись на Python (c Pandas, PyPDF2 или pdfplumber, и pyodbc) или любом другом языке (C#, VBA).
- Необходимость детальной настройки полей таблицы и соответствия извлекаемым данным согласовывается с исполнителем.
- После завершения должен быть предоставлен работающий код или исполняемая сборка с минимальной инструкцией.