Международная премия за достижения в интернете The Webby Awards выпустила отчет о трендах 2024 The Race to Outpace (рус. «Гонка на опережение»), посвященный применению искусственного интеллекта. Мы собрали самые интересные факты из исследования и подборку инструментов, которые могут повысить эффективность работы, с кратким описанием, ссылками и комментариями экспертов JetStyle.
Главные факты из исследования
Одна из основных частей отчета Webby — данные опроса двух тысяч американцев, проведенного компанией YouGov. Вот главные факты, основанные на цифрах:
1. В 2023 году объем инвестиций в стартапы, связанные с искусственным интеллектом, превысил 23 миллиарда долларов — это вдвое больше, чем в 2022-м.
2. По мнению респондентов, сильнее всего развитие искусственного интеллекта влияет на специалистов из сферы медиабизнеса (>70% опрошенных считают так). При этом люди из сфер рекламы, медиа, производства и технологий позитивнее всего относятся к развитию ИИ.
3. Меньше всего ИИ влияет на работников ритейла (<40%).
4. Почти 40% людей считают, что использование искусственного интеллекта приведет к сокращению числа рабочих мест.
5. Четыре ключевых направления, в которых люди могут сотрудничать с искусственным интеллектом, чтобы улучшить свои возможности на работе и за ее пределами: производительность, персонализация, креативность, социальное воздействие.
6. 62% респондентов хотят, чтобы ИИ повысил их производительность. Около 48% работников говорят, что уже часто используют для этого ИИ-инструменты, а 26% из них — очень часто.
Мне кажется, наиболее вероятный сценарий повышения производительности при использовании нейросетей такой: люди смогут работать по три дня в неделю, а в видеопродакшенах и геймдеве будут исчезать кранчи — все можно будет успевать вовремя и без переработок.
7. Двое из пяти опрошенных считают, что искусственный интеллект поможет персонализировать покупки в интернете. Почти 60% людей до 34 лет считают, что компании должны использовать искусственный интеллект для предоставления более качественных услуг и продуктов. Они больше всего заинтересованы в лучшей персонализации и эффективности.
8. Почти 40% людей считают, что ИИ окажет положительное влияние на креативность и создание контента. Большинство называет улучшение качества работы и генерацию новых идей главными мотиваторами начать использовать ИИ.
Я заметила, что люди, которые используют ИИ для креатива, часто берут первую генерацию и не думают о том, как сделать что-то интереснее. Мне это не близко — я обычно не беру в работу первый же результат, а довожу его до ума. Но в этом плане у меня нет большой нужды в ИИ — с креативом я и так справляюсь.
Я бы хотела, чтобы ИИ взял на себя то, в чем я слаба или на что нет времени: переговоры, оценка, продвижение. Отсюда мысль: если ИИ не возьмет на себя эту работу, то самыми востребованными станут продюсеры и менеджеры.
9. 64% считает, что ИИ может положительно повлиять на решение глобальных проблем окружающей среды, образования, здоровья и безопасности населения.
Подборка полезных инструментов
Для каждого из четырех направлений применения ИИ в исследовании есть список полезных инструментов. Мы добавили к нему краткие описания и комментарии наших ИИ-гуру, которые давно сотрудничают с искусственным интеллектом: арт-директора Константина Остроухова, дизайнера Алексея Перминова и моушн-дизайнера Ляйсан Тороповой.
Для продуктивности
Чат-бот, который работает аналогично ChatGPT. Может генерировать текст, переводить с одного языка на другой, создавать различный контент типа текстов и кода, решать математические задачи, распознавать изображения.
На старте Гугл провалились с раскруткой Барда и в медиа проиграли ChatGPT. Однако это пока что один из лучших бесплатных аналогов и конкурентов GPT, с помощью которого можно решать примерно те же задачи за некоторыми исключениями.
Мне показалось, что Bard хуже GPT, особенно потому, что GPT-4 стал искать в Бинге информацию о внешнем мире, а Bard просто ее сочинил. Но в целом, если перепроверять информацию, вполне неплохо.
Аудиоредактор, который может удалить фоновый шум и заменить фрагменты записи, подобрав похожий голос и интонацию.
Мы используем сервис ИИ-дикторов ElevenLabs. Это сокращает наши затраты на дикторов, плюс теперь нет проблем с изменениями в тексте и их переозвучкой на поздних этапах работы.
Это цифровой помощник в программах Офиса: Word, PowerPoint, Excel, OneNote и Outlook. На основе разных данных он может, например, подготовить тезисы к предстоящей встрече или транскрипт прошедшей, написать новость или письмо, создать презентацию, проанализировать таблицу с цифрами и сделать выводы.
Корпоративная диалоговая платформа, которая автоматизирует поддержку сотрудников, анализирует их опыт и создает информационные панели производительности.
Лингвистическая модель, которая позволяет быстро и точно находить ответы в данных клиентов, экономя время и вычислительные ресурсы.
Платформа для разработчиков, с помощью которой они могут быстро создавать генеративные приложения и чат-боты на базе модели Gemini, даже не имея экспертизы в области машинного обучения.
Генератор перевода и озвучки видео. Нейросеть заменяет актера дубляжа — автоматически переводит речь в видеороликах на другие языки, сохраняя тембр голоса спикера и адаптируя движение его губ под сгенерированную дорожку. В списке возможных языков нет русского, но нейросеть умеет с ним работать.
Инструмент для рерайта текстов: проверит грамматику, орфографию и пунктуацию, использует более удачные слова, перефразирует предложения.
Для креативности
Графическая нейросеть DALL-E, в которой можно создавать фотореалистичные изображения. Название нейросети — комбинация имени художника Сальвадора Дали и имени робота Валли из мультика Pixar.
В DALL-E можно создавать и фотореализм, и любой другой стиль. Но теперь там есть ограничения по авторскому праву, и просто попросить использовать стиль какого-то художника не получится. Зато можно хитрить и намекать, хоть это и дольше. Реальный плюс DALL-E 3 — запрос можно все уточнять и уточнять, меняя детали, например, поворот головы или ракурсы, оставляя остальное примерно таким же. Работает неидеально, но иногда пригождается.
На данный момент DALL-E наиболее точно выполняет запрос по сравнению с другими генеративными нейросетями, однако и у него есть свои минусы и особенности работы. Активно применяю в работе наравне с Midjourney.
Кстати, о нашем опыте использоваться DALL-E в коммерческих проектах мы рассказывали в двух кейсах «Уральских авиалиний»: про тушканчика и про бархат.
Нейросеть для генерации и редактирования видео, фотографий и аудио, которые можно использовать на сайтах, в блогах, социальных сетях и рекламных материалах.
Несмотря на удобный UI и размашистую пиар-кампанию, Runway во многом уступает бесплатному (!) аналогу Pika. Некоторые задачи его платные опции решить не могут, в то время как активно развивающийся бесплатный Pika решает почти с ходу. На данный момент единственное, в чем он лучше — это в том, что позволяет генерить более длинные видео и большего формата, чем Pika.
Онлайн-сервис для рисования от Google, который распознает зарисовки пользователей и превращает их в более качественный рисунок.
С задачей преобразования скетчей в готовые изображения нам помог NewArc. В нем мы делали мокапы для логотипов — например, металлические значки по векторному силуэту. И это было быстрее и удобнее, чем с ControlNet в Stable Diffusion.
AI-редактор для создания изображений на основе текстовых промтов и графических набросков и для преобразования изображений — изменения деталей, улучшения качества.
Прикольно поиграться, но пока не считаю Krea полноценным инструментом для работы или творчества. Стилей там не очень много, ссылки в промте на известных художников не работают, настройки довольно простые и не детальные. Можно применять, чтобы довести очень грубый скетч до проработанного, поиграть с ракурсами и композицией, но доводить стиль и качество придется другими инструментами.
Krea интересный инструмент, в котором есть всё, но ничего из этого не доведено до приемлемого уровня. Казалось бы, есть стили, но качество генераций не очень. Казалось бы, умеет дорисовывать изображения, но делает это плохо. Может заменить лицо сгенерированного персонажа на ваше, но сделает это не сильно и похоже на вас. И так во всем.
Генератор сценариев и раскадровок. По текстовым промтам создает сцены, персонажей и визуальные эффекты в различных стилях.
Генератор эмодзи в стиле Apple по текстовому описанию.
Генератор UI-дизайна интерфейсов по текстовым описаниям. Выдает проекты, которые можно редактировать в Фигме.
Генератор 30-секундных музыкальных треков в стиле одного из девяти известных исполнителей. Искусственный интеллект пишет текст песни, создает основную вокальную дорожку, бэк-вокал и инструментальную партию.
В список инструментов для креативности я бы добавила Vectorizer.AI. Он очень круто делает вектор из растровой картинки. И, конечно, ChatGPT — его можно просить помогать придумывать идеи, например, давать разные варианты метафор или слоганов.
Для персонализации
Чат-бот, который помогает анализировать информацию о клиентах и создает AI-персоны, чтобы узнавать, о чем думает целевая аудитория бизнеса. Так можно, например, понять, кто ваш клиент, узнать, какой контент ему интересен, получить фидбэк о сайте и промоматериалах.
Агрегатор персонализированных новостей. Приложение предлагает индивидуальную новостную ленту на основе предпочтений пользователя и его платных подписок на новостные сайты. А еще составляет краткие описания новостей, чтобы можно было быстро понять, стоит ли погружаться в текст полностью.
Языковая модель, которая обучена на большем наборе данных текста и кода, чем GPT4. Самый простой способ доступа к PaLM 2 — использовать Bard AI.
Платформа персонализации контента для любых сфер бизнеса. Технологии позволяют автоматически выбирать контент для показа на сайтах, в приложениях, в рекламе, мессенджерах и имейл-рассылках в зависимости от разных факторов — например, предыдущих действий пользователя или даже погоды.
Mailchimp Marketing Automation
Персонализированные автоматические имейл-рассылки, которые активируются на основе определенных действий или поведения пользователей: подписки на новости, покупки или отказа от покупок.
Платформа для автоматизации имейл-рассылок и прочих рекламных материалов. Генерирует убедительные сообщения, побуждающие клиентов к целевым действиям. Использует маркетинговый язык из релевантной бизнес-сферы, учитывает особенности аудитории и формата.
Технологии управления качеством работы веб, non-веб, мобильных, облачных и потоковых приложений. Обеспечивает единый охват всей цепочки доставки приложения: от пользователя через облако к ЦОД.
Сервис компьютерного зрения, который извлекает информацию из изображений и видео: распознает лица и генерирует по ним метаданные — пол, диапазон возраста, эмоции, дополнительные атрибуты, например улыбку. Также распознает текст.
Для социального воздействия
Веб-приложение для изучения американского языка жестов в теории и на практике. Технология отслеживает движение рук пользователя, а искусственный интеллект создает их трехмерную модель и определяет правильность выполнения действий. Все это происходит в формате игры.
Автоматизированная система для улучшения скорости, эффективности и пассажиропотока городских автобусов. Технология помогает выявлять случаи нарушений правил дорожного движения, а именно — парковки машин на полосах для автобусов и в зонах остановок.
Веб-приложение для мониторинга лесов на всей планете. Создано, чтобы предотвращать незаконную вырубку и пожары, охранять земли и ресурсы.
Огромная библиотека глобальных данных о пчелах на основе облачных технологий для пчеловодов, ученых и исследователей, которые борются за благополучие различных экосистем.
Технология распознавания состава ткани и автоматической сортировки текстиля для дальнейшей его переработки. Из-за того, что текстиль не сортируется, менее 1% этих отходов перерабатывается в новую одежду. Refiberd может помочь направить до 70% потока текстильных отходов на переработку.
Адаптивная учебная платформа, которая предоставляет студентам университетов персонализированные материалы курса в зависимости от их целей и на основе их успеваемости.
Неинвазивный сканер тела для мониторинга здоровья. Может находить и следить за ростом родимых и пигментных пятен, а также сыпи. Обнаруживает отклонения в работе сердца, в системе артериального давления и нарушения пульса. Анализирует данные и выдает результаты и рекомендации для врачей и пациентов.
По моему наблюдению, в 2023 году все внимание было сосредоточено на инструментах, которые появлялись из ниоткуда. Лично я не вспомню ни одного ИИ, который развивался, допустим, с 2016-го и тут наконец стал крутым. Все крутое появлялось здесь, сейчас и очень внезапно: Pika, Suno, HeyGen. Сейчас в этой сфере настолько большая конкуренция и борьба за внимание пользователя, что у ИИ-стартапов просто нет шанса на ошибку. Но, конечно, хочется верить, что те ребята, которых в своей подборке упоминают Webby, в 2024 году действительно перейдут на новый уровень.
Нейросети. Опыт JetStyle
Мы всегда говорим, что искусственный интеллект — это не конкурент, а помощник диджитал-специалистов. Как именно роботы ассистируют нам — мы рассказали в статьях AI-картинки в XR, PR и HR: на какую работу мы уже «нанимаем» роботов и Дизайнер + ChatGPT: как, когда и зачем мы создаем сервисы без привлечения кодеров.
Делитесь в комментариях, как вы относитесь к искусственному интеллекту, в чем он вам помогает и какими инструментами пользуетесь!
А если вы еще только хотите узнать, как можно применять нейросети для решения ваших задач — пишите нам в Телеграме: @jetstyle_bot. Обсудим и придумаем вместе.