Обучить/адаптировать готовую нейросеть для генерации изображений лиц с фьюзингом

Задание закрыто
Статус рабочей области:Закрыта по истечению срока выполнения работ
Стоимость:15 000 рублей
Срок выполнения:9 дней
Варианты оплаты:Планируется использовать Безопасную сделку
Дата публикации:2024-08-21 13:23
Был(а) на сайте:2024-10-13 16:21

Обучить/адаптировать готовую нейросеть для генерации изображений лиц с фьюзингом

 
Задача

Сразу уточню, устроит какой-то готовый репрезиторий, который вы можете собрать и настроить. Можно stable defusion или одну из её версий.

Нужно обучить (настроить, сделать, я буду дальше пользоваться термином "обучить") GAN для генерации картинки по текстовому описанию. Картинки - лица людей. Это может быть редактирующая сеть (фьюзинг) поверх лица человека - так даже лучше. В идеале - на вход принимать текстовые описания, текстовые маркеры. Условно - "сделай глаза как у Эммы Уотсон" или там "глаза: Эмма Уотсон 88%, Дженна Ортега 12%" или "Улыбка" (поменять просто закрытый рот на улыбку).

Важно - использовать маску. То есть - я должен иметь возможность задать области, на которых будет происходить генерация. Скажем, есть желание изменить только глаза или только нос. Область может задаваться в виде пиксельной маски, как вариант - обсуждаемо.

Возможно в будущем будет доп задание (отдельным заказом за отдельную плату) - потребуется последовательное редактирование ка...

Видеть полную информацию и оставлять заявки могут только авторизованные пользователи.
Исполнитель по этому заданию выбран.
Станислав Гулевич
Специализация: Тексты
  • 15 000 руб9 дней
1. Выбор и настройка репозитория
Stable Diffusion: Начнем с установки базовой модели Stable Diffusion. Рекомендуется использовать версию, которая уже поддерживает различные плагины и модификации, такие как Automatic1111 WebUI.
ControlNet: Установите плагин ControlNet поверх Stable Diffusion. Этот плагин позволяет использовать маски для управления процессом генерации изображения.
2. Настройка окружения
Убедитесь, что у вас установлены все необходимые библиотеки и зависимости, такие как torch, transformers, diffusers, и другие, требуемые для работы с Stable Diffusion и ControlNet.
Настройте GPU для ускорения процесса генерации и обучения.
3. Загрузка и настройка модели
Загрузите предобученную модель Stable Diffusion. В большинстве случаев она уже готова к использованию для генерации изображений по текстовому описанию.
Подключите ControlNet к этой модели. Для этого потребуется настроить скрипты, которые позволят использовать маски для управления генерацией определённых областей изображения.
4. Тестирование генерации с масками и текстовыми маркерами
Подготовьте тестовые текстовые описания и маски для различных участков лица, таких как глаза, нос, рот.
Проверьте, как модель генерирует и изменяет изображения на основе текстовых маркеров и масок.
5. Дополнительное обучение (если нужно)
Если предобученной модели недостаточно для ваших задач, вы можете провести дообучение модели на вашем датасете лиц. Это позволит модели лучше адаптироваться к вашим требованиям.
6. Интерфейс для работы
Для удобства работы можно создать веб-интерфейс на базе Automatic1111 WebUI, который позволит вам легко загружать маски, вводить текстовые описания и получать результат.
Ресурсы: https://github.com/AUTOMATIC1111/stable-diffusion-webui
https://github.com/lllyasviel/ControlNet
Takeda Daicha
Специализация: Программирование и IT
  • 15 000 руб9 дней
Привет, имею большой опыт в разработке скриптов, сайтов, парсеров и просто програм на python, одним словом пишу всо, также пишу приложения на Андроид, с удовольствием возьмусь за работу, сделаю всо в лучшем виде и в кратчайшие сроки, также помогу запустить и разобраться.

Мое портфолио: https://ochistka35.wixsite.com/daichasportfolio
Мой телеграм: https://t.me/daichitakeda

Оставлять заявки могут только авторизованные пользователи.