Парсер файлов файлообменника

7 000 руб. за проект • электронные деньги
05 марта 2019, 20:41 • 4 отклика • 56 просмотров
Есть файлообменник и список страниц с файлами к нему, вида:

http://www.manualsdir.com/manuals/160966/keurig-b7...

Необходимо пройти капчу и выкачать документ, который я укажу в начале скрипта.

Особенность задачи в том, что капча довольно простая, и поэтому ее можно (а от того и нужно) разобрать без сторонних сервисов типа рукапчи - разобрать сторонними библиотеками автоматического распознавания либо написанным алгоритмом для этого.

Допускается, что 50% распознаваний будут ошибочными - так как в некоторых экземплярах капчи по ссылке выше она немного невнятно показана, в таком случае мы просто попробуем скачать документ с новой капчей снова. Файл сохранить под случайным именем в папку.

Требования:

1. Использовать ООП в случае, если над задачей будут работать одновременно 3 и более программиста. Так как эту задачу будет решать один человек - ООП не используется для экономии ресурсов, лишь в крайних случаях и при наличии реальной необходимости
2. Выполнить задачу за 3 дня
3. Для скачки файла использовать curl - для возможности позже прописать прокси

@glebovic