Техническое задание: Парсинг контактных данных

Цель проекта

Собрать полный набор контактных данных с двух целевых разделов веб-сайта.

Источники данных

  • Раздел для поиска агентов
  • Раздел для поиска брокеров

Требуемые данные для сбора

  • Имя и фамилия
  • Номер телефона (включая WhatsApp, если доступен)
  • Адрес электронной почты
  • Физический адрес
  • Все остальные доступные контактные и профильные данные

Особые условия

  • Сбор должен производиться со всех географических локаций, представленных на сайте.
  • Необходимо обеспечить полноту данных - нужна информация по всем существующим записям.

Требования к результату

Форматы файлов:

  • Файл в формате CSV
  • Файл в формате TXT (или аналогичном, как указано в задании)

Структура данных:

Структура выходных файлов должна соответствовать стандартному формату для импорта клиентских данных, принятому в популярных CRM-системах (например, как в Shopify для импорта клиентов). Это подразумевает четкое колоночное структурирование и корректные заголовки полей.

Разработка бота для автоматической рассылки результатов тестирования

Требуется создать бота для Telegram и VK (Max), который будет автоматически получать данные из Google Таблицы и отправлять клиентам персонализированные результаты. Рассматривается вариант генерации PDF-бланков.

Обработка табличных данных с помощью OCR и ручной коррекции

Необходимо преобразовать данные из таблиц в цифровой формат с использованием технологии распознавания текста. После автоматической обработки требуется ручная проверка и корректировка числовых значений для их точного соответствия оригиналу.