Как ИИ превращает текст в изображение
Базовый промпт
- субъект;
- детали;
- окружение;
- стили и атмосфера.
Но что точно у всех нейросетей одинаково, так это знание языков: английский они понимают намного лучше русского. Даже если вы на постоянной основе общаетесь с нейронкой по-русски, в какой-то момент всё равно придется перейти на английский. Например, чтобы задать стиль.
Элементы промпта
- Проблемы начинаются, когда мы пытаемся описать два субъекта. Они могут сливаться воедино, дублироваться или просто не появляться. Чтобы увеличить шансы на успех, можно указывать точное количество субъектов и особенности каждого. Не two people, а one man, one woman. Еще можно описать расположение каждого относительно другого или добавить негативные промпты.
- Дизайнеры AGIMA очень внимательны к деталям и готовы помочь даже с самыми сложными задачами. Оставляйте заявку, и мы с вами свяжемся.
- На этапе базового промпта не стоит чересчур увлекаться окружением и деталями. Достаточно задать пару важных моментов, а дальше постепенно докручивать, добавляя вводные. Сгенерированное изображение во многом и само будет подсказывать, что можно убрать, а что сохранить. Небольшие уточнения должны восприниматься нейросетью как менее значимые.
- К стилям относятся не только жанры рисования и живописи, но и манера конкретных художников. Если написать в промпте By Vincent Van Gogh, вы увидите на картинке его характерные черты. Также можно указывать платформы, для которых предназначено изображение. Например, ArtStation или DeviantArt. В этом случае ИИ тоже поймет, чего именно вы ожидаете.
- Приложение с примерами стилей и промптами для них — для Stable Diffusion.
- Коллекция из 106 стилей с примерами — для Stable Diffusion.
- Еще одна библиотека стилей — для MidJourney.
Что такое LoRA и почему это круто
В Stable Diffusion LoRA можно подключить там же, где мы пишем промпт. Вы загружаете ее и указываете, насколько сильно она будет влиять на изображение
- Нашей команде дизайна не нужно давать никаких подсказок. У нас свое видение, и оно помогает нам находить оптимальные визуальные решения. Расскажите нам о своей задаче.
Советы по формированию базового промпта
1. Пишите как для машины, а не как для человека. Как я и говорила, лучше использовать английский язык, четко задавать субъект, избегать опечаток и ошибок, отделять части промпта друг от друга запятыми. Модели вроде Stable Diffusion 1.5 и 2.1 вообще лучше работают с тегоподобными описаниями.
2. Важно не сколько слов мы используем, а какие это слова. Вообще в разных моделях разные ограничения по количеству символов. У Midjourney это 60 слов, а у Stable Diffusion — примерно 75. Но базовый промтп не стоит превращать в книгу: лучше задать ему образ четко и по делу, а доработать позже.
3. Проверяйте ключевые слова. Если вы задаете стиль какого-то художника, но ИИ его игнорирует, вероятно, модель просто его не знает. Если сомневаетесь в промпте или каком-то его составном элементе, вбейте этот элемент отдельно и посмотрите, как модель с ним работает в целом.
4. Некоторые атрибуты тянут за собой другие. Нейронка понимает смыслы не так, как человек. У нее есть ассоциации, и она подтягивает одни атрибуты к другим. Например, голубые глаза могут подтянуть европейские черты лица. Если описывается атрибут, который может нести ассоциации (а они не нужны), лучше дописать, что именно вы хотите видеть.
5. ИИ хорошо понимает, как общаться с ИИ. Не знаете, как составить базовый промпт — просто попросите об этом ChatGPT. Он справится с этой задачей на отлично. Также есть специальные сайты: PromptHero, PromptBase и др. Но все они а целом следуют перечисленным здесь советам.
Дорабатываем базовый промпт
Веса и приоритеты
Пример сгенерирован в MidJourney
- ((cat)) > cat:1,21
[cat] > cat:0,9
Негативные промпты
Поле для негативных промптом в Stable Diffusion
--no ugly
--no deformed
--no bad anatomy
--no disfigured
--no extra limbs
--no extra fingers
--no mutation
--no cropped
Веса и негативные промпты можно совмещать
- Дизайн-команда AGIMA совмещает в своих решениях смелых находки и давно изученные приемы. Какая у вас задача?
Советы по доработке базового промпта
2. Усиливайте слабые места и убирайте лишнее. Тут важно действовать постепенно и поступательно. Не переделывайте с нуля, а плавно влияйте на изображение с помощью негативных промптов или корректировки промпта. Какому-то элементы можно добавить вес, какому-то сократить. Рано или поздно вы добьетесь идеального баланса.
3. Играйте с формулировками. Одну и ту же вещь можно описать разными словами. И соответственно, ИИ воспримет их тоже по-разному. Особенно это хорошо работает, если мы говорим об эмоциях: например, angry почему-то чаще лучше, чем furious, хотя это синонимы. Где-то лучше написать кратко, а где-то подробно. В общем, нужно пробовать.
4. Не превращайте промпт в шведский стол. Иногда промпт разрастается, потому что хочется добавить всё. Это провоцирует противоречия: одна часть промпта начинает мешать другим. Тогда появляются глюки и лишние артефакты. Становится всё сложнее разбираться, где и что сломалось. Так что в какой-то момент лучше притормозить.
Продвинутые инструменты
IMG2IMG
Так выглядит панель управления IMG2IMG в Stable Diffusion
С помощью ползунка denoising вы контролируете, как сильно поменяется исходник
— изменить стиль картинки, но при этом сохранить позу или композицию;
— повысить разрешение — неочевидная опция;
— создать несколько вариаций одного изображения;
— использовать в качестве основы реальные фотографии.
- Создаем креативные концепции, дизайн-системы и брендинг. Оставляйте заявку на сайте.
Inpaint
С помощью этого инструмента можно совершенствовать изображение в мелочах
— исправлять отдельные артефакты;
— дорисовывать детали;
— менять объекты локально;
— менять фон или его части;
— комбинировать картинки.
Hires Fix
Так прошла наша первая встреча
ControlNet
Общий обзор нейронок