Нас часто спрашивают, заменят ли нейросети живых людей, а мы всегда отвечаем, что искусственный интеллект — это не конкурент, а помощник диджитал-специалистов. Как именно роботы ассистируют нам в XR, PR и HR и как выбрать нейросеть под задачу — все ответы в одном тексте дал арт-директор digital-продакшена JetStyle Костя Остроухов.
AI в XR: помогает презентовать идею и создавать ассеты
Мы делаем VR-игры для LBE, у нас уже есть три тайтла: Killer Tennis, Battle Magic и RevolVR, в них можно поиграть на VR-аттракионах в Канаде и Америке. Также мы делаем VR-райды и обучающие симуляторы.
Нейросети наша XR-команда обычно использует для генерации концептов и ассетов — цифровых компонентов игр и других продуктов. Расскажем подробнее о каждом случае.
Для генерации концептов
Нейросети позволяют быстро сгенерировать картинку-образ, чтобы передать нужное настроение и продать идею заказчику. Также эти картинки могут служить вдохновением для следующих этапов работы после продажи.
Причем с помощью ИИ можно не только генерировать обычные картинки, но и создавать 360°-панорамы. Есть сервис kuula.co, в который можно загружать эти панорамы, чтобы потом в шлеме попадать в получившийся мир.
Skybox AI — сервис, в котором можно рисовать в VR и на основе этого генерировать локацию для виртуального мира.
Для генерации ассетов
С помощью нейросети, например Texture Hell, можно быстро генерировать текстуры. Мы задаем тайл — фрагмент текстуры, нейросеть на основе него генерирует бесшовную картинку, которую мы можем масштабировать, и это выглядит хорошо, а не как текстура, которую размножили.
Слабые места нейросетей
У нейросетей в контексте создания контента для целей XR пока плохо получается:
- img to 3D — генерировать трехмерную модель на основе картинки;
- автоматическая развертка трехмерной модели для текстурирования.
AI в PR: помогает быстро создавать контент для каналов коммуникации
Мы используем нейросети, чтобы создавать иллюстрации для своих публикаций на разных площадках. Это бережет время. К примеру, раньше, чтобы получить картинку для поста в наши социальные сети, нужно было около восьми часов: сначала пиарщики брифовали дизайнера, затем через три часа он выдавал первые эскизы, 80% иллюстрации было готово только часов через пять, и еще три часа на доделки.
Когда пришли нейросетки, дизайнер смог создавать картинку для поста за четыре часа. Почему не за пять минут? Потому что иллюстрация должна вписываться в наш TOV (tone of voice) и транслировать наш бренд — а этого просто нейросетью не добиться, поэтому дизайнер тратит время на то, чтобы доработать сгенерированный визуал.
Иллюстратор в паре с нейросетью готовит картинки еще быстрее — у него выше уровень визуальной культуры, больше насмотренности. Условно, когда нужно создать мрачную картинку, иллюстратор вспомнит Ханса Гигера, а джун-дизайнер не вспомнит. Плюс иллюстратор может брать более сырые результаты из нейронки — у него для их доработки больше инструментов.
Пайплайн
Вот в какой последовательности мы выполняем задачи по подготовке визуалов для PR-целей:
1. Бриф, обсуждение идеи
Арт-директор, дизайнер и PR-менеджер определяются с визуальной метафорой, которая будет отражать суть материала. Например, у нас был курс по UI для игр, и мы придумали изобразить на визуале контроллер.
2. Поиск промта
- В Сommunity Midjourney — просто вводим запрос в поиске, находим картинку в нужной стилистике и копируем промт;
- в других сервисах, которые генерируют промт на основе изображения.
3. Генерация и уточнение промта
Изменяем промт, если результат не такой, как мы ожидали.
4. Редактирование в Фотошопе
Берем понравившуюся картинку, перекрашиваем ее в наши цвета, замазываем то, что не нужно, и добавляем свои детали. В случае с контроллером мы добавили на экран сердечки, потому что тема поста — курс по UI.
5. Анимация
Анимируем получившуюся картинку — и вуаля!
Мы проходим все четыре этапа, потому что не пытаемся создать суперпромт, по которому получим суперкартинку, а собираем все из частей — так быстрее.
Иллюстрации для лонгридов
JetStyle — знатный поставщик контента на тему диджитала на разные информационные площадки. Для одной из них нам нужно было наладить процесс генерации иллюстраций, чтобы оформлением текстов мог заниматься контент-менеджер без помощи дизайнера.
Путем проб и ошибок мы поняли, что нужно формулировать очень короткий промт и в каждом указывать одни и те же характерные условия: изометрия и бизнес-иллюстрация. Мы написали гайд по генерации картинок для контент-менеджера и сейчас тестируем, как он с этой задачей справляется — пока все идет хорошо.
Слабые места нейросетей
У нейросетей в контексте создания контента для целей PR пока плохо получается:
- инфографика — сложно делать иконки для сайта, потому что искусственный интеллект не понимает метафоры, не держит единообразие и не умеет в вектор;
- анимация — очень много глитчей, которые выдают автора.
AI в HR: добавляет веселья
С 2020 года, когда все ушли на удаленку, у нас в компании появилась традиция каждую пятницу устраивать общий зум-созвон. Чтобы мотивировать народ не лениться и участвовать во встрече, мы придумываем активности и используем для этого нейросети. Например:
1) Нейрокрокодил — модератор задает промт, а участники по картинке пытаются его отгадать.
2) Оскар скиллов — голосуем за скилл, которому хотим научиться. При этом каждый скилл иллюстрирует сгенерированная картинка.
Кстати, о том, какие еще форматы корпоративного досуга мы проводим для того, чтобы оставаться одной командой даже на удаленке, читайте в статье Культура и взаимодействие в распределенных командах: зачем солить огурцы онлайн?.
А вообще, нейросети можно использовать и для очных мероприятий. Например, мы сгенерировали дипломы для нашей корпоративной спартакиады.
Бонус: AI в коммерческих проектах
К нам обратилась авиакомпания «Уральские авиалинии» с задачей сгенерировать визуалы для продвижения распродажи авиабилетов. Заказчик придумал концепцию — показать людям альтернативные варианты привычного отпуска на примере животных, которые обычно не покидают своего ареала. Мы нагенерировали картинки в Midjourney и дорисовали их в DALL-E.
Подробности о том, как мы работали над проектом, читайте в кейсе-статье Тушканчик-турист и другие фантазии в соавторстве с Midjourney и DALL-E для промо «Уральских авиалиний».
Какую нейронку выбрать?
Midjourney
1. Простой интерфейс в виде чат-бота в Discord, в который нужно только написать свой запрос и получить в ответ готовое изображение.
2. Есть community — база нагенерированных разными пользователями картинок, которые можно использовать в своих целях. Там есть не только бесплатные картинки, но и картинки с определенным планом. Чтобы здесь не оказалась ваша картинка, нужно оплатить Private mode.
3. Дополнительные настройки — можно использовать картинки и фото как промт-референс и дорисовывать изображения по краям с помощью Zoom out.
4. Несколько режимов работы — есть артфильтр, паттерны и т. д.
5. Бесплатный доступ закрыли, но есть разные тарифы, в том числе недорогие — чтобы просто протестировать и понять, хотите ли вы стать промт-инженером.
Stable Diffusion
1. Сложная установка и интерфейс: придется воспользоваться инструкцией и поразбираться, что значат разные слайдеры.
2. Всё понимает буквально — запросы должны быть очень точные. Условно, по запросу man Midjourney что-нибудь нафантазирует и выдаст фантастичную картинку, а Stable Diffusion сгенерирует очень куцего персонажа. Ей нужно задавать стилистику, чтобы получить желаемый результат.
3. Более сложная система промтов — для каждого промта нужно указывать вес, чтобы получить наилучший результат.
4. Более управляемая за счет количества контроллов. Чего не сказать о Midjourney — она безумная и в каждый реролл промта выдает новый результат.
5. Есть крутые функции:
- outpainting — нейронка может дофантазировать окружение в той же стилистике;
- inpainting — нейронка может перерисовать часть картинки.
6. Ранее запускалась в браузере через Google Colab бесплатно, но недавно стала платной. При этом нейросеть по-прежнему можно установить локально на свой компьютер бесплатно, но потребуется мощное железо.
DALL-E 2
1. Интерфейс проще, чем у Stable Diffusion. Если найти аналогию из мира технологий, то Midjourney — это Apple, Stable Diffusion — Linux, а DALL-E 2 — Windows.
2. Тоже воспринимает промты буквально.
3. Результат получается менее художественный и детальный, в отличие от Midjourney, но обладает своим шармом.
4. Тоже есть outpainting и inpainting.
5. Система оплаты представляет собой покупку токенов: один токен — одна генерация.
Adobe Firefly
1. Пока в бета-версии и в закрытом доступе.
2. По отзывам, крутой удобный интерфейс.
3. Нейросеть обучена на Shutterstock — датасете Adobe.
4. Есть инструменты графического дизайна — можно сделать листовку, обложку для книги, визуал к посту.
Шедеврум и ruDALL-E
1. Российские аналоги от Яндекса и Сбера.
2. Датасет, на котором их обучали, меньше, поэтому и вариативность картинок меньше, и детальность страдает.
3. Вероятно, в будущем они вырастут и будут заметны.
4. Сейчас с ними можно поиграться бесплатно.
Умные мысли в конце
1. Не надо ставить самоцелью делать все с помощью нейросетки — решить задачу быстрее и качественнее получится, если работать руками с использованием разных инструментов.
2. Нейронки — это не великий уравнитель скиллов, а, скорее, множитель. Они не уменьшают значимость скиллов специалиста, а помогают ему добиваться лучших результатов быстрее.
3. Нейронки — это куча фана, и это может быть полезно для корпоративных целей.
А какие у вас есть идеи о том, как агентства могут применять нейросети? Давайте обсудим в комментариях и сделаем корпоративную жизнь друг друга еще интересней.
Ну и наше классическое: если вы хотите узнать, как можно применять нейросети для решения ваших задач — пишите нам в Телеграме: @jetstyle_bot. Обсудим и придумаем вместе.
А если вы сильный промт-инженер и хотите работать в нашей команде — подписывайтесь на наш телеграм-канал: @jetstyle_ru. Там мы постим вакансии с хештегом #jetwork.