Парсер для сайта реестра строительных компаний

Цена договорная • безналичный расчёт, электронные деньги
16 ноября 2016, 14:22 • 6 откликов • 163 просмотра
Цель

На портале reestr.nostroy.ru размещены общедоступные данные реестра СРО в строительстве и реестра строительных компаний участников СРО. Необходимо собрать данные по СРО и по участникам СРО и опубликовать их как открытые данные

Задача

  • написать парсер для сайта reestr.nostroy.ru на языке Python
  • выгрузить все данные в формате CSV или JSON или XML
  • загрузить набор данных на github и на хаб открытых данных hubofdata.ru
Требования
  • открытый исходный код в Github в репозитории
Пожелания
  • сделать описание к выгруженным данным. Структуры данных и набора целиком.
  • использование scrapy будет преимуществом
Примечание
Необходимые данные из реестра СРО

  • ссылка на страницу с организацией в реестре
  • Рег. номер
  • Полное наименование
  • Сокращенное наименование
  • Адрес местонахождения
  • Федеральный округ
  • ИНН
  • ОГРН
  • E-mail
  • Адрес сайта
  • Телефон
  • Руководитель коллегиального органа СРО
  • Руководитель исполнительного органа СРО
  • Статус
Необходимые данные из реестра участников СРО:
  • ссылка на страницу с организацией в реестре
  • СРО
  • Тип члена СРО
  • Полное наименование
  • Сокращенное наименование
  • Статус члена
  • Регистрационный номер члена в реестре СРО
  • Дата регистрации в реестре СРО
  • Дата прекращения членства
  • Основание прекращения членства
  • ОГРН
  • ИНН
  • Дата государственной регистрации
  • Номер контактного телефона
  • Адрес местонахождения юридического лица
  • ФИО, осуществляющего функции единоличного исполнительного органа юридического лица и (или) руководителя коллегиального исполнительного органа юридического лица
  • Сведения о соответствии члена СРО условиям членства в СРО, предусмотренным - законодательством РФ и (или) внутренними документами СРО
  • Размер взноса в компенсационный фонд СРО
  • Обновлено
А также по аналогичной логике для всех участников СРО необходимо собрать данные из вкладок "Свидетельства о допуске", "Страхование", "Проверки".

Описание этой задачи на Github https://github.com/infoculture/scrapetasks/issues/...

Цена договорная. Результаты должны быть и будут общедоступные и опубликованы в форматах открытых данных.