Парсер с сайта, импорт в базу, экспорт в CSV

5 000 руб. за проект • безналичный расчёт, электронные деньги
31 января 2015, 16:36 • 9 откликов • 96 просмотров
Для интернет-магазина необходимо с сайта поставщика исполнять Парсинг информации загружать ее в базу парсера, а в дальнейшем экспортировать в CSV для Shop-Script 5 (описание файла предоставлю). 

Процесс парсинга, описание:
1. Собираем ссылки (URL)  страниц товаров в несколько этапов
а) http://www.shinservice.ru/catalog/ (начальная страница каталога)
б) http://www.shinservice.ru/catalog/bridgestone/ (переход к производителю)
в) http://www.shinservice.ru/catalog/bridgestone/wint... (переход к конкретной модели)
г) http://www.shinservice.ru/catalog/bridgestone/wint... (переход на определенный размер)

2. После того, как список ссылок сформирован, начинаем парсинг товара, например вот этого:
http://www.shinservice.ru/catalog/bridgestone/wint...
Нужна практически вся информация (кроме описания), то есть:
Наименование, Артикул, Размер (ширина, высота, диаметр), Индексы нагрузки и скорости, Бренд. 
Самое главное - наличие и цена, а также ссылка на картинку (просто урл, без загрузки самой картинки). 

3. Результат парсинга записывается в базу данных парсера, отдельно созданную специально для этих целей. Php, MySQL, как обычно. 

4. Из полученной базы данных необходимо экспортировать в CSV по установленному формату.

5. Парсинг будет и для шин, и для дисков.  

Есть свои определенные тонкости.
- Например наличие, перед каждым запуском парсинга необходимо по всей базе данных (Парсера) обнулять, чтобы не получилось что товара больше нет на сайте поставщика, а в базе сохранилась старая информация.
- Также в базу данных парсера будем заносить только товары, которые есть в наличии от 4-х шт. (комплект) - то есть дополнительная проверка.
- Цена будет формироваться по определенной простой формуле (то есть от цены поставщика + N-рублей). Но в целом это очень простые операции, как правило реализуемые очень просто. 
- И еще парсер должен иметь возможность исключать товары по определенным характеристикам. Например, такие шины как Cordiant интернет-магазин не продает и поэтому их хотелось бы отсекать уже в процессе собирания ссылок (1-й этап) на страницы товаров. 

Предполагается, что парсер будет лежать у меня на сервере и база данных тоже. То есть это не разовая работа, а скрипт - который в дальнейшем будет запускаться ежедневно по Крон (настрою самостоятельно, отдельно). 

По бюджету - рассчитываю на сумму 5 тысяч рублей. Оплата - Яндекс.Деньги, Расчетный счет. 

P.s. Пример CSV-файла прикрепляю к заказу. 

Также описание структуры CSV-файла:
http://www.webasyst.ru/help/26/import-products-fro...
Файлы