Техническое задание: Сбор исторических спортивных данных
Цель проекта
Собрать и структурировать исторические данные о спортивных матчах с одной публичной платформы. Итоговые данные должны быть представлены в виде Excel-таблицы.
Источник данных
Данные являются публичными и находятся на одном целевом сайте. Часть информации представлена в текстовом формате, часть - в виде интерактивных графиков.
Перечень данных для сбора
Текстовые данные (доступны напрямую):
- Название матча.
- Дата проведения матча.
- Общий объем торгов по событию.
Данные с графиков (требуется извлечение):
Информация представлена в виде графика, где числовые значения (коэффициенты) видны только при наведении курсора.
- Начальные коэффициенты на обе команды (на момент старта матча).
- Минимальные коэффициенты на обе команды за всю историю лайва (самые низкие значения за время события).
Дополнительные данные:
- Исход матча (победившая сторона).
Требования к результату
- Excel-таблица на 6-7 столбцов со всеми перечисленными выше данными.
- Обработать необходимо около 4000 матчей.
- Желательное дополнение: Для каждой строки таблицы приложить скриншот соответствующего графика. Это необходимо для быстрой верификации корректности извлеченных числовых данных.
Ключевые моменты
- Работа включает как классический парсинг текста, так и извлечение данных из динамических элементов (графиков).
- Важно обеспечить точность сбора коэффициентов, которые не представлены в виде статичного текста на странице.
- Все контактные данные и прямые упоминания источника в финальном задании опущены.