Сбор и обработка данных с сайта

10 000 руб. за проект
12 октября 2019, 17:34 • 4 отклика • 39 просмотров
Здравствуйте,

Нужно спарсить информацию с сайта:
https://clck.ru/JVMQi

Получить папки по годам:
Например:
https://clck.ru/JVMSA
В папке "2014" должна быть созданная папка "1" в которой должна быть создана папка "127" (пользуйся ctrl+f на странице)
В папке "127" в данном случае должно быть 4 картинки с порядковой нумерацией так как они идут на оригинальном сайте 1,2...
так же должно присутствовать .txt файлы:
Сложность – урони сложности смотри тут: https://clck.ru/JVMXE
Размеры – Если их нет, то должна быть проверена вся страница на совпадение с Размеры или РАЗМ и цифры, следующие за этими словами внесены в файл, но в формате не через дефис, как они бывают там обычно указаны, а через запятую с указанием промежуточных размеров (наприер 22-26, это есть 22, 23, 24, 25, 26) Таблицу размеров мы можете взять тут https://clck.ru/JVMhX. Так же бывают случае как тут: https://clck.ru/JVMfP там присутствует слово сочетание «для невысоких» и его так же нужно добавлять в файл через запятую после размеров.
Описание – в данном случае "Классика никогда не подведет!...неотразим на любом торжестве."
Вам потребуется – если контекста нет, то файл пустой.
Рекомендуемые ткани – если текста нет, то файл пустой.
Теги – тут этот текстовый файл вносятся теги которые есть у данной модели и добавятся рубрика например «Жакеты» как тут https://clck.ru/JVMfP, так же Теги "Для детей" и "Для мужчин" добавить в текст файл "Теги" модели через результат выдачи соответсвующего фильтра https://clck.ru/JVR5q и https://clck.ru/JVR4T. Все оригинальные филтры тут https://clck.ru/JVMwq

От вас сроки и цена роботы.