Нейросеть Kandinsky 3.0 для создания изображений и видеороликов

нейросеть Кандинский

«Сбер» представил обновленную версию нейросети для генерации изображений – Kandinsky 3.0.

Что такое Kandinsky

Kandinsky 3.0 – это сервис для создания изображений на основе искусственного интеллекта, разработанный компанией «Сбер». Он позволяет пользователям создавать оригинальные и уникальные произведения искусства, используя различные стили и техники. Работает на основе диффузионной модели, которая сначала размывает изображение, а потом пытается его восстановить, создавая в итоге новое.

С помощью этого сервиса пользователи могут экспериментировать с различными стилями живописи, включая импрессионизм, кубизм, абстракционизм и другие.

Сервис Kandinsky имеет простой и интуитивно понятный интерфейс, что позволяет даже неопытным пользователям легко создавать и изменять изображения. Он предлагает различные инструменты и настройки, которые позволяют пользователю контролировать степень абстракции, яркость, цветовые схемы и другие аспекты работы.

Модель Kandinsky 3.0 представляет собой улучшенную версию предыдущей модели Kandinsky 2.2 и имеет несколько значительных отличий в своих возможностях:

лучше понимает текстовые запросы;
создаёт ещё более реалистичные изображения;
имеет усовершенствованную функцию редактирования и дорисовки изображений;
намного ближе знакома с культурным кодом России – от советских персонажей и архитектуры до гжели и другого народного искусства.

И, самое главное, теперь с помощью Kandinsky можно не только генерировать изображения в разных стилях, но и создавать короткие видеоролики по текстовым запросам!

Как зарегистрироваться

Переходим на сайт https://www.sberbank.com/promo/kandinsky/.

Здесь предлагается попробовать сервис Kandinsky:

на сайте https://fusionbrain.ai/
с помощью телеграм-бота нейросети – удобный способ, кто предпочитает работу в известном мессенджере;
на сайте ВК – только для генерации изображения;
на всех умных устройствах Sber по голосовой команде «Запусти художника».

Выберем Fusion Brain. Для регистрации в сервисе нажимаем «Начать» в правом верхнем углу сайта или «Открыть редактор» в правом нижнем углу сайта.

регистрация в Kandinsky 2.2

Нужно заполнить форму регистрации: ввести адрес электронной почты и пароль. Пароль должен быть не менее 6 символов, содержать латинские заглавные буквы, строчные буквы и цифры. И нужно обязательно поставить галочку напротив «Я принимаю условия Политики конфиденциальности и Пользовательского соглашения». Затем нажимаем «Зарегистрироваться». После нужно будет перейти по ссылке из письма, которое направлено сервисом на указанный адрес электронной почты, для подтверждения аккаунта.

Как пользоваться

После успешной регистрации на https://fusionbrain.ai/ открывается редактор и можно приступить с созданию изображений.

Если перейти в раздел «Документация», то можно ознакомиться с инструкцией по работе с сервисом.

В нижний части сайта есть поле для ввода текстового запроса «Промпт». Как сообщает сам Kandinsky: «самая простая формула промпта – объект + фон + стиль».

поле ввода запроса в Kandinsky 2.2

Наш запрос:

Кот-космонавт, космос, яркий свет, детали, высокая детализация, яркие цвета, 4k

Для избежания нежелательных деталей на будущем изображении нужно добавить в «Негативный промпт» соответствующее описание.

Затем в «Стиль» можно выбрать готовый стиль для будущего изображения. Сейчас доступны следующие стили:

Рисунок карандашом
Цифровая живопись
Классицизм
3D рендер
Мультфильм
Студийное фото
Портретное фото
Хохлома
Аниме
Детальное фото
Киберпанк
Кандинский
Айвазовский
Малевич
Пикассо
Картина маслом
Пиксель арт

И также выбираем разрешение. Картинки генерируются в пяти разрешениях 1:1 (1024 × 1024 точек), 16:9 (1024 × 576), 9:16 (576 × 1024), 2:3 (680 × 1024), 3:2 (1024 × 680). Нажимаем «Создать» или комбинацию клавиш на клавиатуре «Ctrl+Enter». Немного ожидаем и вот результат:

Сервис генерирует одно изображение за раз. Для сохранения изображения нажимаем «Скачать» на панели инструментов.

Также здесь есть инструмент «Ластик» – позволяет отредактировать сгенерированное изображение. Закрашиваем им часть, которую нужно поменять, затем переходим в «Генерация» (крайняя кнопка слева на панели инструментов), корректируем промпт и нажимаем кнопку «Создать». В нашем случае мы закрасили скафандр и дополнили промпт описанием «кот-космонавт в скафандре фиолетового цвета».

Чтобы ввести новый промпт, нужно нажать на «Сбросить».

Также можно загрузить свою картинку, изображение, нажав «Вставить изображение» на панели инструментов. И, например, можно изменить стиль исходной картинки, выбрав готовый стиль из шаблонов или описав в промпте.

Также с помощью Kandinsky можно дорисовать картинку. Генерируем или загружаем картинку, а затем уменьшаем ее так, чтобы поле генерации было больше изображения. Потом дописываем текстовый запрос или выбираем стиль, после чего нейросеть дорисовывает картинку.

Примеры использования нейросети Kandinsky 3.0

Гостиная в красивом светлом современном доме в скандинавском стиле с большими окнами, выходящими на бассейн.
Стиль: Студийное фото

Пожилой мужчина с морщинами и теплой улыбкой наслаждается утренним кофе в закусочной.
Стиль: Портретное фото

Молодой Киану Ривз в черном длинном кожаном пальто идет по улице под дождем.
Стиль: Детальное фото

Космонавт смотрит кино в кинотеатре и ест попкорн.
Стиль: Студийное фото

Зал великолепного дворца в стиле барокко, наполненный золотыми статуями черепов и картинами с черепами, красивая лестница, картины эпохи Возрождения, мраморные колонны, высокие растения.
Стиль: Свой стиль

Создание видеоролика

Теперь Kandinsky 3.0 позволяет не только создавать изображения по текстовому запросу, но и видео продолжительностью до 8 секунду с частотой около 30 кадров в секунду с разрешением 512 пикселей.

Переходим в раздел «Видео».

Процесс создания ролика прост:

В «Модель» выбираем тип: анимация или видео;
В «Размер» выбираем формат;
Вводим текстовое описание того, что должно быть на видео;
Если выбран стиль «Анимация», то дополнительно выбираем направление камеры;
Нажимаем кнопку «Создать анимацию»/«Создать видео»;
Для экспорта ролика нажимаем «Скачать».

Лимиты и ограничения

Кандинский 3.0 является бесплатной нейросетью и на данный момент отсутствуют какие-либо платные тарифы. Также отсутствуют ограничения на количество генерируемых изображений и видеороликов, что отличает нейросеть от многих других подобных сервисов.

Выводы

Kandinsky – бесплатная нейросеть, которая генерирует картинки и видео по текстовым запросам.
Kandinsky хорошо понимает запросы на русском языке.
В новой версии сделан упор на фотореализм.
Есть официальный телеграм-бот – один из самых удобных способов генерации картинок. Он бесплатный, быстро генерирует и поддерживает основные режимы.
Картинки, сгенерированные моделью Kandinsky 3.0, имеют более яркие и насыщенные цвета.