Анализ выдачи Google Scholar по ключевым словам

6 000 руб. за проект
12 июня 2019, 13:34 • 5 откликов • 41 просмотр
Есть поисковый запрос из двух ключевых слов, по которым в Google Scholar выпадает порядка 4 тыс. статей. И есть еще несколько десятков дополнительных ключевых слов.

Нужно составить датафрейм, в котором каждому ключевому слову соответствует бинарный признак и для каждой статьи указано какие ключевые слова из набора в ней встречаются, год публикации и количество ссылок на нее. Будет здорово, если эти вхождения будут найдены именно в теле статьи, а не в референсах.

Этот датафрейм нужно проанализировать и составить список статей, в которых упоминается наибольшее количество ключевых слов, составить список наиболее часто встречающихся дополнительных ключевых слов.

Использовать нужно python и его библиотеки, результат нужен в виде Jupiter notebook.