Задача
Необходимо разработать простой парсер на PHP, который автоматизирует процесс публикации статей. Это позволит экономить время и исключить ручное копирование контента.
Функционал парсера
Извлечение данных из статьи
- Заголовок статьи
- Текст статьи (без лишнего кода, стилей и скриптов)
- Главное изображение (определяется автоматически)
- Очистка от технического мусора и рекламных вставок
Публикация в WordPress
- Автоматический вход на сайт через wp-rest-api (настройки API Key заранее)
- Добавление выделенной картинки в медиабиблиотеку WordPress
- Установка изображения как обложка (featured image) поста
- Запись поста со статусом «опубликован»
Защита от дублей
- Скрипт должен проверять наличие поста с аналогичным заголовком перед созданием нового. При совпадении пропускать или обновлять.
Работа по расписанию
- Скрипт запускается на сервере один раз в сутки или по триггеру внешнего крона (синхронизация по времени).
- Результат передаётся в тикете после каждого выполнения (пустой повтор - дублирует найденные статьи как уникальный контент дальше)
Выходные данные
- Один готовый файл с расширением .php
- В документации чэковать привязку к росту, редактирование токенов
- Короткая инструкция (3-4 абзаца) по настройке доменов, API, VSphere настроенным ключом, URL протокол HTTPS авторизации для обычного вордпресса
Требования к исполнению
- Все внутренние настройки (базы, имена пользователей, домены) привести сразу в простё исполняемом примере.
- В коде ограничить попытк и запись error уровя (простой минимум ошибок = debug отключить полностью на мину повыше без дампов логов).
Результат
Вы получите единственный осмысленный файл - гарантированно рабочий скрипт под любой cron современной CMS по прямому указанию докуммента константных названии биржери до тестирования. Работа с краткой инcтрукциоза динами ческой кнопке “Запуст”