Техническое задание: Парсинг данных с ЦИАН

Цель проекта

Создать инструмент для автоматизированного сбора информации о риелторских агентствах, работающих с коммерческой недвижимостью (покупка/продажа), со всех регионов Российской Федерации на платформе ЦИАН.

Основные требования

  • Парсинг должен охватывать все регионы РФ, доступные на платформе.
  • Целевая категория: только агентства, занимающиеся коммерческой недвижимостью (активный фильтр "покупка/продажа коммерческой недвижимости").
  • Собранные данные необходимо разместить в таблице, где каждая единица информации находится в отдельной ячейке.
  • В качестве примера структуры данных агентства предоставлен шаблон карточки компании.

Структура выходных данных

Требуется выгрузить информацию по каждому агентству в структурированном виде. Конкретный набор полей (название, контакты, специализация и т.д.) необходимо определить на основе анализа страниц агентств.

Технические примечания

  • Решение должно корректно обрабатывать пагинацию (постраничную навигацию) в каждом регионе.
  • Необходимо обеспечить устойчивость к изменениям в структуре страниц и обработку возможных ошибок.
  • Важно соблюдать политику платформы в отношении автоматизированного сбора данных.

Разработка FullStack платформы для международной доставки посылок

Требуется FullStack разработчик для создания комплексной онлайн-платформы, автоматизирующей логистику международных отправлений. Проект включает разработку системы автоматического назначения курьеров и других ключевых функций.

Извлечение и структурирование текста из большого объема PDF-документов

Требуется извлечь английский текст из более чем 100 PDF-файлов (отсканированных и структурированных) и перенести его в документы Word и Excel с сохранением исходной структуры. Срок выполнения - 3-5 дней.