Доработка парсера ВК

5 000 руб. за проект
19 мая 2024, 17:32 • 11 откликов • 138 просмотров
Необходимо оптимизировать скрипт по читаемости и времени выполнения (чтобы каждый метод был не перегружен вложенными циклами и т.д.), разделить код на несколько модулей по функциональности. При этом код должен быть масштабируемым, то есть при необходимости можно было добавить еще одну группу для парсинга без написания дополнительных функций.
Обеспечить сохранение данных (включая результаты классификации) по мере обработки постов, а не в самом конце
Также найти ошибки, из-за которых в файл выгружаются не все комментарии и посты
Строки с пустым значением, со значением 'speech' или 'skip' в поле 'comment_tonality', а также строки с 'Иная категория' в поле 'post_topic' должны удаляться из датафрейма