Разработать сервис для написания статей на основе LLM

50 000 руб. за проект
26 марта 2024, 05:48 • 9 откликов • 85 просмотров
Необходимо разработать цифровой двойник (digital twin LLM), который после обучения (fine tuning) на материалах автора и других источниках данных, будет писать статьи на заданную тему на русском языке.

Задачи:
  1. Выбрать LLM и обосновать выбор
  2. Выбрать облако и развернуть LLM
  3. Определить формат, в котором необходимо подготовить материалы автора для обучения LLM
  4. Определить формат, в котором необходимо подготовить другие источники данных
  5. Обучить LLM на материалах автора и других источниках
  6. Провести тестирование LLM написав статьи на существующие темы автора
  7. Провести тестирование LLM написав статьи на новые темы
  8. После корректировки автором статей из п. 6 и 7 провести дообучение LLM
  9. Подготовить интерфейс взаимодействия с LLM с помощью которого мы самостоятельно можем дообучать модель и готовить статьи
Материалы автора (все на русском языке): посты в Telegram, посты в Instagram, диалоги в Telegram и Instagram, видео на YouTube, библиотека видео файлов.

Другие источники данных (большинство будут на английском языке): книги в формате PDF, видео на YouTube, текстовые статьи.