Задача
Провести проверку нескольких статистических гипотез на основе сырых и разнородных массивов данных о ценах с маркетплейсов.
Основные требования
- Подготовка и очистка трёх массивов:
- Массив 1 - 241 630 записей
- Массив 2 - 5 395 201 запись
- Массив 3 - 234 507 записей
- Провести корреляционный анализ цен
- Выполнить регрессионный анализ зависимости цены от факторов (детали факторы уточненяются исполнителю)
- Сравнить частоту ценовых изменений на основе распределения
- Построить и проанализировать временные ряды
- Сформировать сводный отчёт по полученным гипотезным результатам
Формат данных
Стек и инструменты для обработки не менять: требуется Python (Pandas, NumPy, statsmodels, scipy). Все строки и ссылки запрещены - важен ID заявки и объем, остальное согласуется в ЛС.