Техническое задание: Очистка базы email-адресов от проблемных записей

Контекст задачи

Имеется база данных электронных адресов, которая прошла первичную проверку валидности через SMTP-сервис. Однако после этой проверки в базе остаётся категория так называемых "проблемных адресов", которые требуют дополнительной фильтрации.

Цель проекта

Разработать и внедрить механизм для автоматического выявления и исключения проблемных email-адресов из существующей базы данных заказчика.

Примеры проблемных адресов (для понимания паттернов)

  • sch58@yandex.ru
  • prirechniy@yandex.ru
  • tarmuk@yandex.ru
  • centr@yandex.ru

Основные требования к решению

  • Проанализировать предоставленные примеры проблемных адресов для выявления общих характеристик или паттернов.
  • Создать алгоритм или набор правил для автоматического обнаружения подобных адресов в базе.
  • Разработать скрипт или программу, которая выполнит фильтрацию и создаст очищенную версию базы данных.
  • Решение должно быть масштабируемым и применимым ко всей базе, а не только к приведённым примерам.
  • Предоставить отчёт или логи о количестве и типах исключённых адресов.

Ожидаемый результат

Очищенная база email-адресов, из которой удалены проблемные записи, идентифицированные по заданным критериям. Готовое решение для повторного применения при необходимости.