Hraní s #stablediffusion: Důležitá slova ovlivňující výrazně výstup a jiné drobnosti (a přehršel příkladů)

🖼 Zkoumáte AI pro generování obrázků? Do zadání nezapomeňte na konec přidávat drobnosti co mohou dost zásadně ovlivnit výstup.

  • cinematic photo, highly detailed, cinematic lighting, ultra-detailed, ultrarealistic, photorealism, 8k, octane render
  • cyberpunk lights, Hyper Detail, 8K, HD, Octane Rendering, Unreal Engine, V-Ray, full hd
  • cyberpunk, abstract, full hd render + 3d octane render +4k UHD + immense detail + dramatic lighting + well lit + black, purple, blue, pink, cerulean, teal, metallic colours, + fine details + octane render + 8k
  • ultra photoreal , photographic, concept art, cinematic lighting, cinematic composition, rule of thirds , mysterious, eerie, ultra-detailed, ultrarealistic, photorealism, 8k, octane render
  • a dost zásadní roli hraje painted by a doplnit malíře

Doslova záleží na jednom slově co vám z “AI” vyjde. Chvíli jsem si s tím hrál a “Dungeness Dystopia painted by Ian McQue” jsem měnil jen jednu věc navíc.

🧝‍♂️ Pána prstenů miluju, takže jsem si #stablediffusion vyzkoušel i pro různá témata. Něco umí, ale dostat věci na které se dáí si vyžádalo pár desítek pokusů. Pro tyhle čtyři zajímavé výsledky. Je to jedna z dalších “vlastnosti” hrátek s txt2img – výsledek je značně závislý na

a) jak dobře stvoříte “zadání”, tedy text

b) zda k zadání daná AI má dostatek příkladů, jestli ne, výsledek je prostě shit

👉 Takže prostě některé věcí jdou #stablefusion lépe, některé nedá ani omylem 🙂 Tady jsou příklady toho co jde

👍 stablediffusion v optimalizované podobě (github.com/basujindal/stable-diffusion) je to co chcete pokud vám to hází CUDA out of memory. Šlape to _ a ano, i překlepy jsou běžnou součástí zadání. U auta jde o prompt z příkladů, u toho dalšího je překlep můj

Jo, a zvládne to 768×768 na mé 8GB GPU, 1024×768 už ne.

NASA launching rocket at Cape Caneveral in heavy rain