LoacalAI

Prostředí EasyDiffusion poskytuje uživatelům širokou škálu parametrů, které mohou být užity pro optimalizaci výsledků při generování obrázků. Tyto parametry umožňují uživatelům kontrolovat různé aspekty procesu generování a přizpůsobit výstupy jejich specifickým potřebám. Níže jsou uvedeny hlavní parametry, které mohou být nastaveny.

Prompt (výzva)

Textový popis je základním vstupem pro generování obrázku. Uživatelé zadávají text, který popisuje, co má být na obrázku vygenerováno. Stavba a struktura promptu jsou klíčové pro výsledný obrázek.

Image Modifiers (modifikátory obrázku)

Modifikátory umožňují upravit výsledný styl obrázku přidáním specifických atributů, jako jsou styly vykreslení, barvy, techniky a mnoho dalších.

Dostupná nabídka modifikátorů může také posloužit jako inspirace pro sestavení promptu.

Seed (semínko)

Semínko je náhodné číslo, které inicializuje generátor. Použití stejného čísla s identickými parametry povede ke stejnému výslednému obrázku, což je užitečné pro replikaci a jemné ladění výsledků.

Number of Images (počet obrázků)

Uživatelé mohou nastavit, kolik obrázků má být vygenerováno a v kolika dávkách. Např. vyplníme, že chceme vygenerovat celkem 4 obrázky ve 2 dávkách. Budou se tedy vygenerovat 2 obrázky najednou. To je užitečné pro porovnávání různých variant a výběr nejlepšího výsledku.

Model

EasyDiffusion umožňuje uživatelům vybrat specifický model nebo verzi modelu, který bude použit pro generování obrázku. Různé modely mají různé schopnosti a styly, což poskytuje další úroveň přizpůsobení.

ControlNet

Tento parametr umožňuje použít kontrolní obrázek k vedení AI při generování nových obrázků. Tento parametr pomáhá AI přesněji následovat vybraný styl, tělesnou pózu nebo kompozici z kontrolního obrázku. Na rozdíl od image-to-image transformace, která aplikuje úpravy na původní obrázek, ControlNet dokáže extrahovat smysluplné informace z kontrolního obrázku a použít je k vytvoření zcela nových obrázků v podobném stylu.

Pro ukázku tohoto parametru jsem zvolila jako výchozí obrázek, ze kterého bude generátor čerpat kompozici, styl a tělesnou pózu, známý snímek z filmu Kmotr. Prompt, který jím bude ovlivněn zní Johnny Depp. Filtr spolu s modelem ControlNet parametru pro tyto účely nastavíme na Canny.

VAE (Variational Autoencoder)

VAE zlepšuje kvalitu generovaných obrázků. je trénováno na různé aspekty obrazu. Výchozí VAE model v uživatelském rozhraní EasyDiffusion (vae-ft-mse-840000-ema-pruned) specificky vylepšuje detaily očí na generovaných snímcích.

Sampler (vzorkovač)

EasyDiffusion nabízí různé "samplery", které mohou produkovat odlišné výsledné obrázky. Každý sampler má vlastní unikátní metodu, jak převést vstupní data na konečný obraz.

Je dobré vyzkoušet různé samplery, abyste zjistili, který z nich nejlépe odpovídá vašim potřebám. V tomto případě nelze přesně predikovat a určit, který sampler používat pro jaký styl obrázku, jako je to třeba u modelu. Různé obrázky mohou vypadat lépe s různými samplery. V kapitole modelů jsem se však snažila vybrat spojení modelů a samplerů, které spolu dobře fungují.

Image Size (velikost obrázku)

Uživatelé mohou nastavit šířku a výšku výsledného obrázku. Vyšší rozlišení produkuje detailnější obrázky, ale také vyžaduje více výpočetního výkonu, času a použití modelu, který s daným rozlišením umí pracovat. Běžné nastavení zahrnuje šířku a výšku v pixelech (např. 512×512, 1024×1024).

Inference Steps (počet kroků)

Počet kroků určuje, v kolika iteracích proběhne vygenerování obrázku. Více iterací obvykle vede k lepším výsledkům, ale také zvyšuje čas potřebný k vygenerování obrázku.

Guidance Scale (naváděcí škála)

Tento parametr určuje, jak silně model sleduje zadaný textový popis. Vyšší hodnoty vedou k obrázkům, které jsou více v souladu s popisem, ale mohou také omezit kreativitu modelu. Hodnoty se obvykle pohybují mezi 5 a 20. Stable Diffusion nabízí stupnici od 1,1 do 50.

Seamless Tiling (bezešvé dlaždice)

Jedná se o techniku, která umožňuje vytváření vzorů, které se mohou opakovat bez viditelných spojů nebo okrajů, což vytváří hladký a jednotný vzhled. Tato může být žádané při tvorbě opakujících se textur pro herní prostředí, pozadí plakátů, tapet ap.

Vygenerovanou dlaždici a její kopie lze vedle sebe umístit tak, aby vytvořily plynulý, opakující se vzor bez viditelných přechodů. je možné vybírat mezi horizontálním, vertikálním a přechodem v obou směrech.

Output Format (výstupní formát)

Možnost volby formátu výstupních obrázků, jako jsou PNG, JPEG nebo WEBP včetně možnosti zapnutí bezztrátové komprese.

Parametry generování ve Stable Diffusion