Парсинг и текстовая коррекция пятистраничного сайта
Требуется скачать сайт, удалить несколько страниц и блоков, а также заменить несколько строк текста. Важно сохранить исходную структуру, но убрать указанные элементы и контакты.
Требуется скачать сайт, удалить несколько страниц и блоков, а также заменить несколько строк текста. Важно сохранить исходную структуру, но убрать указанные элементы и контакты.
Современный рынок данных требует молниеносной обработки: мониторинг цен конкурентов, сбор контента для ML-моделей, автоматизация рутины. Заказчику нужен чистый и быстрый код, исполнителю — прозрачные метрики и справедливая оплата. На этой странице мы собрали концентрированный опыт сотен сделок — от check-points для технического задания до реалистичных вилок прайсов. Здесь нет «волшебных кнопок» и пустых обещаний. Только практическая аналитика, которая позволит заказчику сэкономить до 40% бюджета, а кодеру — повысить чек на 25% за счёт правильной подачи навыков.
| Параметр проверки | Зеленый флаг (+1 балл) | Желтая зона (риск) |
|---|---|---|
| 1. git-статистика активных проектов | есть 3+ репозитория с файлами .ipynb /scrapy | только C++ или пустой гитхаб |
| 2. время ответа | менее 2 часов в будни | более 12 часов или auto reply |
| 3. кейсы: найдете proxy/ bypass? | описание сложностей с Cloudflare | ни одного упоминания антиблокировок |
| 4. формат выгрузки портфолио | архив csv, json (настоящ. объем) | jpeg-наброски/ссылки с 3 строчками |
| 5. ценообразование | ставка почасовая (600-1800руб) + прайс на объекты | процент от проекта или старт от 50$ |
Совет: всегда давайте тест. Оплатите 1-2 часа на отладку парсера для одного урла. Настоящим профи тест не доставит неудобств.
| Тип задачи (LS) | Базовый уровень сложности | Цена (руб) | Deadline (средний) |
|---|---|---|---|
| 1 сценарий: сбор 50-100 товаров с Озон (без captcha) | Легкая (lxml,Selenium) | 4 500 — 7 500 | 2-4 рабочих дня |
| 2: мониторинг цен — 6 категорий / day | Middleware (selenium, cron) | 18 000-25 тр | до 5 дней монтаж |
| 3: AoE — конвейер каруселей WB + selenium proxy broker | Жесткий мидл (+ мультипоточ) | 28-45 t r. | 7-9 дн/нд |
| 4: разблокировка+ капча sun астериск ( антидетек) | хx тяжелый / rare native (apify-like) | 350–760 $ | 13-21 day |
| 5: парс миллионов item для нейросети 10-60 Gb | Big data + техпит-спекр / vertika queue | 210-580тр | 20 раб. дней сдел |