Техническое задание: Сбор медиа-контента и данных
Цель проекта
Автоматизировать процесс извлечения и сохранения графических и текстовых материалов с нескольких целевых веб-ресурсов.
Основные задачи
- Обработать три различных веб-сайта, каждый из которых имеет уникальную структуру организации информации.
- Последовательно перейти по предоставленным ссылкам (около 50 коллекций) для сбора контента.
- Сохранить все изображения тканей (общее количество превышает 700 файлов). Изображения не защищены от скачивания.
- Для 2/3 изображений необходимо выполнить изменение исходного названия файла при сохранении согласно предоставленной инструкции.
- Собрать и сохранить сопутствующую текстовую информацию по коллекциям. Формат сохранения текста - простой TXT.
Исходные данные и процесс
- Исполнителю будет предоставлена таблица со всеми необходимыми ссылками на коллекции, пояснениями и четкими правилами именования файлов.
- Техническое задание составлено подробно, без излишнего усложнения, и содержит все ссылки для работы.
- Работа носит технический, рутинный характер и не требует глубокой разработки.
Требования к результату
- Полный набор изображений (700+ файлов), корректно переименованных согласно ТЗ.
- Текстовые файлы с описаниями коллекций.
- Четкая организация собранных данных.