Техническое задание: Конвертер DOCX в HTML
Цель проекта
Разработать программное решение для автоматического преобразования документов формата DOCX в HTML-файлы с сохранением базового форматирования и структуры исходных документов.
Ключевые функциональные требования
Основные возможности конвертера
- Преобразование файлов .docx в валидный HTML-код.
- Сохранение ключевых элементов структуры документа: заголовков (h1-h6), списков (нумерованных и маркированных), таблиц.
- Применение инлайновых стилей (inline styles) для базовой типографики: жирность, курсив, выравнивание, отступы, шрифты.
- Поддержка изображений: конвертация картинок из документа в формат Data URI для их встраивания непосредственно в HTML-код.
- Пакетная обработка: возможность указать целевую папку, все файлы .docx в которой должны быть обработаны автоматически.
- Формирование отчёта о процессе конвертации (логирование успешных и неудачных операций).
Требования к реализации
- Решение должно быть готово к использованию (standalone).
- Код должен быть чистым, документированным и поддерживаемым.
- Желательна возможность запуска из командной строки с передачей параметров (путь к папке).
Ожидаемый результат
На выходе - набор HTML-файлов, визуально и структурно соответствующих исходным документам DOCX, с изображениями, встроенными в код, и подробный отчёт о выполненной работе.