CFG

CFG (classifier free guidance) on arvo, joka yksinkertaistettuna määrittelee sen miten tarkasti tekoälymalli seuraa syötettyä kehotetta tai toisinpäin kuinka paljon se hyödyntää “luovuuttaan”. Matalilla CFG-arvoilla generointi hyväksyy lopputulokseksi myös sellaiset kuvat, jotka eivät täysin vastaa kehotetta. Suurilla CFG-arvoilla generointi taas ylisuorittaa ja pyrkii löytämään aina vaan paremman lopputuloksen, jota se ei välttämättä koskaan saavuta.

Erittäin matalilla arvoilla lopputulokset saattavat olla luovia ja tuottaa joskus mielenkiintoisia kuvia, mutta niihin alkaa ilmestyä sellaisia ominaisuuksia, joita kuvalta ei välttämättä haluta. Kuvat saattavat olla sumeita tai utuisia ja niissä on usein matala kontrasti. Kuvissa saattaa myös esiintyä ongelmia sommittelun suhteen ja niistä tulee sellainen vaikutelma kuin kuvassa värit olisivat nestemäisiä tai märkiä.

Korkeilla arvoilla generointi noudattaa orjallisesti sille annettua kehotetta, mutta kuvat usein alkavat muistuttaa liian täsmällisesti sitä mitä on pyydetty. Kuvissa on usein korkea kontrasti ja värit alkavat näyttää liian kyllästetyiltä. Erittäin suurilla arvoilla kuvat menettävän usein muotonsa ja alkavat muistuttaa vain väriläiskiä, joilla on etäisesti pyydetyn kehotteen mukaiset muodot.

Seuraavat esimerkit on generoitu kehotteella “photo of castle” käyttäen “Eueler a” sampleria. Ensimmäinen kuva on generoitu käyttäen CFG-arvoa 7, joka on esim. AUTOMATIC111 oletuksensa. Toinen on generoitu käyttäen erittäin matalaa arvoa (1) ja toinen erittäin korkeaa (30). Edellä mainitut ongelmat ovat hyvin näkyvillä esimerkeissä.

CFG 7 CFG 7 CFG 1 CFG 1 CFG 30 CFG 30

Usein oletusarvon käyttäminen riittää, mutta arvoa säätämällä voit saada aikaan mielenkiintoisia kuvia tai täydentää puutteellista kehotetta. Alta löydät esimerkkejä erilaisten arvojen käyttämisestä. Huomaathan, että eri arvoalueet ovat riippuvaisia myös valitusta samplerista, joten yhtä täysin oikeaa vastausta on mahdoton antaa.

CFG Kuvaus
2-6 Lopputulos on luova, mutta ei välttämättä seuraa kehotetta. Kuvassa saattaa esiintyä erilaisia epätoivottuja elementtejä.
7-10 Toimii hyvin useimmilla syötteillä. Kuvassa on pientä luovuutta ja generointi ei pyri liikaa saavuttamaan täydellisyyttä.
11-15 Lopputulos voi parantua, jos kehote on huolella tehty. Pienentää luovuuden mahdollisuutta ja saa näin aikaan juuri sellaisia kuvia joita pyydät.

Näiden rajojen ulkopuolella olevia arvoja on syytä välttää, koska lopputulos ei yleensä juurikaan vastaa sitä mitä pyydetään.

Youtube-kanavalta SiliconThaumaturgy löytyy erinomainen video, jossa tarkastellaan syvemmin CFG-arvon vaikutusta eri samplereilla. Löydät videon täältä.


Oliko kirjoituksesta iloa tai löysitkö siitä virheitä? Voit kommentoida kirjoitusta kommenttikenttään. Muista netiketti!