Техническое задание: Обработка сканированных документов с данными

Суть проекта

Необходимо преобразовать большой объем сканированных документов (примерно 300-350 страниц) в структурированные цифровые данные с последующей ручной проверкой и корректировкой.

Основные этапы работы

  • Распознавание текста (OCR): Обработать все предоставленные сканы с помощью современной системы OCR (оптического распознавания символов) или нейросетевой модели для извлечения текстовой и числовой информации.
  • Верификация и корректировка: Вручную проверить все числовые данные (цифры) в полученном результате, исправить возможные ошибки распознавания и привести их в соответствие с оригинальными документами.
  • Структурирование и форматирование: Подготовить итоговые данные в формате Microsoft Excel (.xls или .xlsx), организовав информацию в соответствии с предоставленным образцом итогового файла.

Требования к результату

  • Данные должны быть максимально приближены к информации в оригинальных документах после корректировки.
  • Итоговый файл должен быть чистым, структурированным и готовым к использованию.