Перечень задач и требований к парсингу Telegram-групп

Техническое задание

Необходимо найти и собрать ссылки на все открытые Telegram-группы, привязанные к перечню населенных пунктов областей. Я предоставлю список городов и деревень, которые нужно проработать. Задачей исполнителя является автоматический или ручной сбор релевантного контента с привязкой к каждому пункту.

Подробные требования

  • Что парсить: ТГ-группы (чаты/каналы), удовлетворяющие заданным городам. Может использоваться фильтр по текстовому наличию названия города в названии, описании или первых сообщениях.
  • В объем задания входит не менее 5 000 различных групп (число уточняется при обсуждении деталей). Конечное количество передается списком из предоставленных населенных пунктов.
  • Критерий релевантности: Группа официально географически позиционируется (группа города/для жителей определенного района/блоги бизнеса в городе).
  • Итог работы: Заказчик получает excel-таблицу с колонками: Ссылка на группу, Название города (или несколько, если она мультигео пользователей), Тип группы (публичная/частная/канал/чат) и возможно количество участников.
  • Сроки: Обговариваются после согласования глубины ручного или API-парсинга.

Ключевой инструментарий и методология

Допускается использование любого доступного ПО. Предпочтительны скрытые методы (парсер, обернутый в ожидания для приватных групп если они объединяют именно город, можно контент-анализировать переписку). Все вопросы рисков блокировки аккаунтов автоматическими действиями снимаются с исполнителя: чистый дамп должен выделяться в поделенную таблицу с метками геосбор - для этого заказчик направит файл соотнесения названий.

Использование прямых REmote API-token агрегация - единственное пожелание.