Написать скрипт для сбора данных с findfood.ru

5 000 руб. за проект • безналичный расчёт, электронные деньги
30 августа 2015, 22:46 • 7 откликов • 83 просмотра
Для сбора данных в Рунете нужно написать скрипты на Python. В результате нужно будет закоммитить скрипт, который будет в STDOUT отдавать JSON по схеме. Более подробную информацию по задачке пришлю на почту/skype.

Хост: http://findfood.ru
Описание:
Необходимо извлечь описание и калорийность продуктов питания.
Нужно собрать:

  • название (title)

  • картинку (image)

  • описание (description)

  • калорийность (energy)

  • белки (nutrients/macros/protein)

  • жиры (nutrients/macros/fat)

  • углеводы (nutrients/macros/carbohydrate)

  • пищевая ценность (nutrients/nutritiveValue), словарь, ключи - текстовые названия элементов

  • витамины (nutrients/vitamins), словарь, ключи - последний компонент url (http://findfood.ru/component/holin -> holin)

  • минеральные вещества (nutrients/minerals), словарь, ключи - последний компонент url (http://findfood.ru/component/ftor -> ftor)

Пример JSON: https://gist.github.com/kslazarev/97b6f858c41c7e9872cf

Технические ограничения

Язык: Python 2.7
Рекомендуемые библиотеки: grab, scrapy, beautifulsoup4, lxml, requests

UPD: Если есть вопросы по задаче, то можно их задавать в комментарии.