Парсер сайта IKEA

Цена договорная • электронные деньги
12 мая 2017, 01:45 • 5 откликов • 112 просмотров
Необходим парсер для Опенкарта последней версии.
Подробнее.

Общее
Парсер крайне хотелось бы на PHP с запуском по крону (из командной строки). Остальные языки (Java, Go, JavaScript, С++ =)) тоже подойдут, но все же PHP предпочтительней.

Категории
Категорий будет 3 уровня. К примеру, берем данную ссылку:
  • черным шрифтом - первый уровень
  • синим - второй
  • при клике на любую категорию второго уровня (например) - серые кнопки, которые при ховере становятся оранжевыми - третий
Тягать их удобно отсюда, но нужно выяснить закономерность, какой уровень после какого идет. Еще один ньюанс - категории на сайте то добавляются, то пропадают. Соответственно, "включать-выключать" их в Опенкарте должен и парсер. СЕО-теги заполнять не требуется (за исключением title).


Товары
Данные, которые необходимо забирать (пример страницы - здесь):
  • название (ФАБРИКОР в примере)
  • артикул (303.631.79)
  • краткое описание (Шкаф-витрина, серый)
  • цена (цены бывают акционные - нужна обычная)
  • изображения (все, в no-js версии сайта я их не нашел, может плохо искал ))) - 3х размеров каждое
  • все данные с вкладки "Информация о товаре" внизу (в т.ч. инструкцию в виде pdf)
  • размеры товара (ширина, высота, объем и прочие) нужно организовать в виде Опенкартовских атрибутов
  • у товаров, имеющих вариативные размеры-цвет-прочие атрибуты (цвет на вышеуказанной странице), в Опенкарте должны выглядеть так же (иметь выпадающий список с возможными вариантами)
По аналогии с категориями, товары должны "включаться-выключаться" по мере появления на сайте ИКЕА.

Ждем ваши прайсы :)