Парсер данных

888 руб. за проект
09 июня 2021, 17:35 • 6 откликов • 51 просмотр
Необходимо для двух страниц со списком научных статей получить данные.
Ссылки на страницы.
https://www.jmlr.org/papers/v21/ и https://www.jmlr.org/papers/v22/

спарсить для каждой статьи и записать в файл следующие данные:
название | авторы | год | ключевые слова | abstract

Под каждой статьей находятся три ссылки: [abs][pdf][bib]
Из блока [bib] можно взять данные для блоков название, авторы, год.
Ключевые слова можно получить нажав на ссылку pdf, на первой странице каждого pdf файла после абзаца Abstract есть блок keywords из которого нужно взять данные.
По ссылке [abs] можно получить текст для последнего поля abstract.

в качестве разделителя столбцов использовать символы которые не будут встречаться в описании abstract, например: | или ~
Отзывы
 
3 года назад