Техническое задание: Скрипт для парсинга JSON-файлов
Цель проекта
Разработать автономный скрипт, который автоматизирует процесс сбора и обработки данных из специфичных JSON-файлов, расположенных в древовидной структуре папок, с последующим сохранением сводных результатов.
Основные требования к функционалу
1. Запуск и навигация
- Скрипт должен запускаться либо из целевой рабочей папки, либо принимать путь к ней в качестве аргумента командной строки.
- Программа рекурсивно обходит все вложенные папки в указанной директории.
2. Логика поиска и чтения файлов
- В каждой папке необходимо искать подпапку с названием
input. Папки output следует игнорировать. - Внутри папки
input нужно найти файл с точным именем input_intensities.json. - Если файл отсутствует, скрипт переходит к следующей папке. В одной папке
input может быть только один такой файл.
3. Обработка данных
- Для каждого найденного JSON-файла необходимо извлечь все числовые значения по ключу
"intensity". - Вычислить среднее арифметическое этих значений (сумма всех значений, деленная на их количество).
- Полученный результат умножить на 10.
4. Экспорт результатов
- Все обработанные данные необходимо записать в единый файл формата Excel (XLS или XLSX).
- Структура таблицы:
- Столбец A (Номер): Порядковый номер записи (1, 2, 3...).
- Столбец B (Дата): Название файла-источника (например, 01-12-2025_23-21-45).
- Столбец C (Значение): Рассчитанное итоговое значение (например, 2,7).
- Файл с результатами должен создаваться или перезаписываться при каждом запуске скрипта.
Требования к реализации
- Скрипт должен быть написан на Python.
- Код должен быть чистым, документированным и устойчивым к ошибкам (отсутствие файлов, некорректный JSON и т.д.).
- Необходимо использовать стандартные или популярные библиотеки (например,
json, pandas/openpyxl, os, argparse).