Пример изображения (люди в лодке) для ультра фирокоформатного экрана (32:9)
Пример изображения (люди в лодке) для ультра фирокоформатного экрана (32:9)

Как самому генерировать обои на телефон и компьютер в нейросети. Апскейлеры

Уже после первого опыта генерации изображений в нейросетях, у многих возникает резонный вопрос: Как и где я могу применить эти замечательные картинки? Тут речь не идет о профессионалах, обычный человек скорее всего захочет поместить свое творение на заставку телефона или рабочий стол компьютера и планшета. К сожалению, не все так просто, программы генерации "из коробки" такое делать не могут, придется пойти на хитрости:

Stable Diffusion и 4k широкоформатные обои

Пример ультра вертикального изображения в эльфийском стиле

Рассмотрим создание широкоформатных обоев в Stable Diffusion, хотя способы применимы и для других систем генерации. Проблема в разрешении генерируемого изображения. Первые (старые) модели генерации, такие как SD 1.5, плохо подходят для обоев. Исходное изображение всего 512x512 пикселей, и что более важно, вытянутый вертикальный формат обоев для телефона или установка широкоформатного разрешения для современных мониторов при генерации обычно приводит к дублированию объектов на изображении и самым разным артефактам. Чем дальше мы уходим от "квадратного" формата, тем больше получаем уродливых и странных картинок.

Впрочем, это время уже уходит, использование SDXL (и других "свежих" генераторов) устраняет эти проблемы, наш квадрат теперь 1024х1024 пикселя и "вытягивать" его можно почти как угодно по ширине или высоте, композиция нашей задумки будет стабильна и хорошо уложена в заданный формат.

Следующая проблема это разрешение экрана для обоев, оно у современных мониторов и даже телефонов далеко не маленькое и исходного Stable Diffusion XL 1024х1024 мало кому хватит. Генерируя на своем оборудовании и пытаясь задать например 4k формат (3840х2160 пикселей), даже мощная игровая видеокарта уйдет в глубокую задумчивость, а ваш Automatic1111 зависнет. Сервисы генерации тоже скорее всего не позволят вам выставить такое разрешение. На помощь приходят Апскейлеры, технологии увеличения и даже улучшения изображения.

Апскейлеры

Имея под рукой апскейлер, мы просто генерируем нужное нам изображение в уменьшенном формате, а потом его увеличиваем. Благодаря SDXL можно делать даже ультра широкие обои (21:9 или 32:9), так для статей этого сайта используются шапки 1600х400 пикселей, и они изначально сгенерированы в SDXL в этом формате. Если их увеличить в апскейлере, мы получаем обои для самого широкого монитора из существующих (32:9), а для него обоев очень мало во всем интернете, как и просто изображений такой конфигурации.

Но где взять апскейлеры? Если вы генерируете сами на своем компьютере в Automatic1111 они уже есть (популярный ESRGAN, BSRGAN и другие). Их использование это отдельная и не самая простая история. Поэтому, особенно если мы говорим о начинающих AI художниках, разумнее, проще и быстрее использовать сторонние приложения и программы, даже если вы генерируете сами в Автоматике, и уж точно, если вы генерируете онлайн на сайтах или в приложениях.

Онлайн апскейлеров уже много, в том числе и бесплатных, вот например upscayl.org, где можно даже скачать бесплатную программу апскейлер на свой компьютер и ни от кого не зависеть в этом вопросе. Кстати, если онлайн площадки для генерации изображений предлагают вам генерировать картинки выше 2k формата, они тоже применяют внутренние апскейлеры, просто не сообщают вам об этом.

Итак, делать обои самых разных форматов в генераторах не сложно, используем SDXL или другие (новые) генераторы и увеличиваем при помощи апскейлера. Нужный нам формат в пикселях делим на 2 или на 4 и генерируем выставив полученный уменьшенный формат. А вот создание по настоящему интересных и уникальных обоев, это уже художественный процесс, зависящий исключительно от их автора. 

Пример фентези изображения лежащего орка для широкого формата
Фентези изображение лежащего орка для широкого формата

Промпты

Для примеров изображений в этом материале в SDXL сделаны ультра широкие и вертикальные композиции, как видим, запрашиваемые изображения хорошо укладываются даже в эти необычные форматы (1600х400 и 600х1600 пикселей).

  • Пример изображения (люди в лодке) для ультра широкоформатного экрана (32:9), промпт: "flooded forgotten village, reflections, fog, (peasants in a boat rescue from the water:1.6), low angle from below, ais-fld, High detailed RAW color Photo, 8k"
  • Пример ультра вертикального изображения в эльфийском стиле, промпт: "elven architecture, High detailed RAW color Photo, 8k, sunlight"
  • Пример фентези изображения лежащего орка для широкого формата, промпт: "lying orc woman, full body, High detailed RAW color Photo, 8k, sunlight"