Недавно мы рассказали о нейросети Stable Diffusion, а сегодня познакомимся с ещё одним инструментом для генерации картинок – нейросетью Kandinsky и разберем как ей пользоваться.
Что такое нейросеть Кандинский
Kandinsky — нейросеть от Сбера для генерации изображений по текстовым запросам, по аналогии с Midjourney и DALL-E. Кандинский создает фотореалистичные, художественные и абстрактные изображения. Особенность Kandinsky — поддержка более 100 языков и возможность писать промпты на русском.
Функции Kandinsky:
- Генерация по текстовым запросам: введите промпт на английском или русском языке, и нейросеть создаст изображение. Можно задать стилистику, фон, уточнить детали.
- Вариации готовых изображений: покажите нейросети уже существующую картинку и попросить изменить её стиль и детали.
- Объединение стилей: нейросеть может комбинировать стили из разных изображений, создавая уникальные работы.
- Дорисовка: можно взять фото или картинку и попросить нейросеть дополнить ее деталями.
- Работа с анимацией: Kandinsky умеет генерировать не только статичные изображения, но и короткие анимационные ролики.
Преимущества:
- Удобство использования: простота интерфейса делает нейросеть доступной даже для начинающих пользователей.
- Разнообразие стилей: в панели настроек нейросети можно выбрать стиль изображения: от карандашной иллюстрации и советских мультфильмов до киберпанка и фотореализма.
- Скорость работы: генерация изображений занимает минимальное время в сравнении с конкурентами.
Недостатки:
- Ошибки детализации: при работе с фотореалистичными изображениями нейросеть может некорректно отображать некоторые детали (лица людей, архитектурные элементы).
- Некорректное чтение длинных промптов: в некоторых ситуациях Kandinsky путается в длинных промптах, поэтому для получения результатов придётся несколько раз упрощать или корректировать текстовый запрос.
Как пользоваться нейросетью Кандинский
Воспользуйтесь возможностями нейросети Kandinsky с помощью:
- Fusion Brain. Официальный тестовый сайт нейросети. Потребуется регистрация по e-mail.
- Сайт ruDALL-E. Функционал сервиса ограничен только генерацией по текстовому запросу. Не требует регистрации.
- Телеграм-бот Kandinsky.
Интерфейс и основные функции Kandinsky
Интерфейс Kandinsky интуитивно понятен и состоит из разделов:
- Главная панель: здесь находятся основные инструменты для создания и редактирования изображений, поле для промпта и загрузки изображений-референсов.
- Панель параметров: слева располагаются настройки генерации, где выбирают стили, цвета и другие параметры.
- Пространство для просмотра: в центре отображается текущее состояние создаваемого изображения.
- Панель управления: сверху находятся кнопки сохранения и экспорта.
Генерация картинок нейросетью Кандинский
Работать с нейросетью Kandinsky очень просто. В Telegram выберите режим работы, нажать соответствующую кнопку и введите текстовый запрос или загрузите изображение. Сервис бесплатный и быстро выдаёт результаты.
Но удобнее пользоваться нейросетью на сайте Fusion Brain, поскольку вы сразу сможете задавать тонкие настройки для генерации, имея полный доступ к интерфейсу.
Настройка стиля
Стиль задают прямо в текстовом запросе или выбирают из меню. Если нужного стиля нет в списке, оставьте параметр «Без стиля» и укажите его в запросе. Нейросеть уже имеет много шаблонов стилей и пресетов: от киберпанка до советских мультфильмов.
Также доступны тонкие настройки: интенсивность цвета, детализация и глубина, яркость, насыщенность и контраст.
Параметры изображений
Доступны разные соотношения сторон и разрешения для изображений:
- 1152×768;
- 1024×1024;
- 680×1024;
- 576×1024.
Дорисовка и создание новых элементов
Функция дорисовки добавляет детали к уже созданным изображениям. Выделите часть изображения, оставьте пустую область и введите текстовую команду. Kandinsky добавит нужные элементы.
Также на сайте есть функция расширения границ изображения – дорисовка объектов по его краям.
Инструмент «Ластик» (Erase)
Инструмент «Ластик» на сайте Fusion Brain стирает части изображения и добавляет новые элементы по текстовому описанию.
Перенос стиля и смешивание изображений
Kandinsky переносить стиль с одного изображения на другое, сохраняя позы и общие очертания объектов. Например, можно заменить человека на портрете, сохранив композицию и фон.
При смешивании двух изображений система объединяет их случайным образом, что может привести к неожиданным и интересным результатам.
Сохранение и экспорт изображений в нейросети Кандинский
Кандинский поддерживает различные форматы файлов (JPEG, PNG, TIFF и др.), что выбрать наиболее подходящий для ваших нужд.
- JPEG: универсальный формат – хорошее качество при умеренном размере файла.
- PNG: идеален для изображений с прозрачным фоном или высокой четкости.
- TIFF: рекомендуется для печати и профессиональной работы благодаря высокому качеству и отсутствию сжатия.
Советы и рекомендации по Kandinsky
- Экспериментируйте с параметрами: не бойтесь пробовать разные настройки и стили, чтобы найти оптимальный вариант.
- Используйте референсы: они помогут создать более точные и качественные результаты.
- Обращайте внимание на детали: мелкие корректировки могут существенно улучшить итоговое изображение.
Частые ошибки и их исправление:
- Размытость изображения: проверьте настройки разрешения и детализации.
- Неправильные цвета: убедитесь, что цветовая палитра и настройки соответствуют вашим ожиданиям.
- Перегруженность деталями: слишком много мелких элементов может сделать изображение сложным для восприятия. Умерьте количество деталей в промпте для достижения лучшего результата.