Парсер linkedin

Цена договорная • электронные деньги
23 января 2018, 23:35 • 1 отклик • 25 просмотров
Приветствую, нужен парсинг линкедин. Имеется каталог: https://www.linkedin.com/profiles/directory/name-a/
Парсим всех из него.

парсим следующее:

имя, фамилия,
должность, компания, универ, количество связей, опыт работы, образование, навыки, интересы


Далее все это собирается в базу. В которой мы можем:

1) Использовать минус-слова по нужным нам категориям. (например, имя и слово "Лера". Все люди с именем Лера, удалятся)

2) Плюс слова по нужным нам категориям. Например, имя и слово "Лера". Все люди с именем Лера, останутся.

Этап фильтрации многоступенчатый. Т.е. операции плюс и минус слов могут использоваться несколько раз. Как в обычной бд.

А
также понадобится рейтинг по самым популярным совпадениям. Приведу
пример. У нас есть категория Имя. Софт считает, сколько имен совпадает и
выстраивает рейтинг от самого большого количества к самому меньшему.

Если у нас в Списке:

Сергей Филатов
Сергей Есенин
Александр Пушкин

Софт выстроит все так:

Сергей - 2
Александр 1