Скачать копии вебсайтов для локального использования

5 000 руб. за проект
20 сентября 2019, 10:57 • 3 отклика • 81 просмотр
Скачать для локального использования указанные разделы вебсайтов согласно этого списка – https://clck.ru/J358m (Реестр ссылок на открытые данные Правительства РФ и подведомственных организаций; там примерно 70+ ресурсов с данными).

Критично получить локальную копию: (1) всех CSV-файлов с датасетами, (2) CSV- и других файлов с описанием структуры или аннотациями содержания датасетов, (3) страницы с перечнем опубликованных данных. Именно это будет проверяться в первую очередь. Качать все директории от указанной вглубь.

Скачанные версии сайтов разложить по папкам, проименованным полным названием организаций (колонки A и B в перечне сайтов).

Скачанные версии сайтов должны читаться в браузере Chrome под Windows и Mac OS. Использоваться будут на ноутбуке. Предусмотреть, чтобы всякие дизайнерские навороты (Java-скрипты, CSS и проч.) не мешали навигации и просмотру локальной версии в отсутствии Интернет-соединения; корректность перехода по гиперссылкам в локальной версии должна быть соблюдена; на отключенном от Интернета компе все должно открываться и читаться на русском языке.

Конечный объем данных мне не известен. Результат передать через облачное хранилище.

Можно пользоваться специальными программами (HTTrack, SiteSucker и т.д.), приоритет отдавать той, которая обеспечит качественное выполнение задачи. Можно со мной согласовать условия ее использования.