Техническое задание: Парсинг данных из PDF реестра залогов
Цель проекта
Создать PHP-скрипт для автоматического сбора и обработки информации из PDF-документов, публикуемых в открытом государственном реестре уведомлений о залоге движимого имущества.
Основные требования к функционалу
- Реализовать парсинг данных из PDF-файлов, доступных на официальном сайте реестра.
- Обеспечить поиск информации по залогодателям - физическим лицам с использованием комбинации критериев:
- Фамилия, имя, отчество (или фамилия и имя).
- Дата рождения.
- Структурировать извлеченные данные в удобный формат (например, JSON или массив) для дальнейшего использования.
- Учесть особенности структуры PDF-документов реестра.
Технические детали
- Язык реализации: PHP.
- Источник данных: PDF-файлы с официального сайта реестра.
- Важно: В коде не должно быть прямых упоминаний или ссылок на конкретные сторонние сервисы, названия компаний, телефоны или email. Работа ведется исключительно с открытыми данными.
Ожидаемый результат
Рабочий PHP-скрипт, который по заданным параметрам (ФИО и дата рождения) находит, загружает (если требуется) и парсит соответствующие PDF-файлы, возвращая четко структурированную информацию из них.