Перевод:
Первая унифицированная многоточечная многомодальная рамка диффузии. Универсальная Диффузия может естественно поддерживать преобразование изображения в текст, вариацию изображения, текст в изображение и текстовую вариацию, а также может быть дополнительно расширена до других приложений, таких как разделение семантического стиля, двойное направляемое поколение изображений и текстов, редактирование скрытых изображений-текстов-изображений и другого. В будущих версиях будут поддерживаться более многомодальные функции, такие как речь, музыка, видео и 3D.
Метки: Stable Diffusion, WOW, Генерация
Задача Создать изображения
По материалам: neurolist.ru