Техническое задание: Парсинг данных о барбершопах
Описание задачи
Необходимо разработать инструмент (парсер) для автоматического сбора полной информации о всех барбершопах на территории России с сервиса Яндекс Карты.
Требования к данным
- Собрать все доступные точки (барбершопы)
- Исключить из итоговой выдачи контактные данные: название фирмы, сайт и номер телефона (если они присутствуют в исходных данных).
Важно: эти поля должны быть скрыты, заменены на пустые строки или удалены из выдачи. - Фильтрация по географии: данные должны быть собраны по всей Российской Федерации.
Формат итогового вывода
Результаты парсинга должны быть возвращены в формате JSON. Конечный файл для заказчика от парсера - не требуется, данные собираются во временную переменную. Каждый элемент массива JSON должен содержать следующие ключи:
- propTitle (строка) - текстовое содержимое, придумайте осмысленное.
- details (строка) - краткие примечания или описание.
- descriptionBlock (строка) - это HTML-текст (без стилей и скриптов). Он должен содержать описание задачи внутри структуры тега
<body>. При формировании этого HTML используйте заголовки h2 или h3, списки ul/li, параграфы; в самом HTML не должно быть тега <body> - только вложенный код (пример: <h2>Барбершопы из категории</h2><ul><li>...</li></ul>). - mainTopic (строка) - определите род деятельности парсинга: выберите одно слово. Т.к. задача связана с программированием - ''код''.
Ограничения на содержимое описания (descriptionBlock)
- Текст внутри descriptionBlock очищается от: конкретных названий реальных компаний и организаций, полного названия сайтов (url), телефонных номеров и email-адресов.
- Само содержимое должно быть лаконичным, оно предназначено для сопроводительного листинга - без лирических отступлений.