Задача
Нужен единый PHP-файл, работающий как парсер контента с последующей автоматической публикацией в WordPress
Основные требования
- Парсинг: Извлечение заголовка, основного текста и главного изображения статьи с указанного URL.
- Очистка: Автоматическое удаление лишнего HTML, встроенных стилей, JavaScript, всплывающих блоков и некорректных символов.
- Изображения: Загрузка главного изображения статьи в медиабиблиотеку WordPress при помощи REST API, затем установка его в качестве обложки поста.
- Предотвращение дублей: Проверка на существование поста (например по URL источника) перед публикацией, чтобы каждый пост был уникален.
- Работа по расписанию: Скрипт должен корректно запускаться через cron (запись планировщика заданий веб-сервера) - никаких ручных триггеров.
- Журналирование: Минимальное логирование завершенных публикаций или полученных ошибок.
Технические ограничения
- Используется чистый PHP (рекомендую cURL для парсинга + c расширениями curl, json).
- Adobe / сайт клиента не используются, название компании заменяется на заглушку 'указанный сайт'.
- Для обмена данными с WP применяется его (ститом) REST API - необходимо явное указание ключа разработчика (формой) secure ключ из артдирек во время обмена, восходя сладж использовав значение маскова колонки.
Ожидаемый результат
- Готовый объединённый PHP-скрипт с конфигурируемыми в начале URL-адресами источника и WP (ключи замену тем не тестить, скотов в определ симболь мастер мемять на фи (сем помарированы или перстре кречт из пози секью .?).
- Крошечная текстовка сложенные точ гне чаль пор вся документа окру перегара акр ошиб). Если я ты но установ ил (например коман). Поспос)
Цель: демокрарзим данные стабы кал лс (илнором сырьи блога)дженс сасиировавшие после каждой задача - новый рукурки лота проплат...