05/24 Digital storyline-workshop 

Digital workshop fredag 3. mai 2024

Program:

Vi skal her se på hvordan vi kan benytte ulike KI-verktøy for bildegenerering, i de ulike fasene/delene av et storyline-prosjekt. Merk at KI-verktøy også vil være svært nyttige for å generere rent skriftlige beskrivelser. Noe av det spennende med KI er imidlertid hvordan skriftlig tekst og andre medietyper kan brukes i samspill, for på den måten å utvikle et helhetlig univers.

Her vil vi imidlertid fokusere på arbeidet med tekst i direkte sammenheng med bildeskaping.

Illustrere Storyline ved hjelp av KI

Kunstig intelligens og storyline

Noen tjenester

Sted

Gi stedet et navn og en historie – bruk gjerne KI som verktøy i ideutviklingen.

Bing Copilot gir oss følgende fire forslag.


Ut fra norske forhold, på begynnelsen av 1900-tallet, ser dette mer ut som en by. En norsk bygd vil ha langt færre hus, og bygningene vil i hovedsak være bygget i tre.

Vi ber om "Færre hus. Kun en liten båt. Hus bygget i tre".

Vi får igjen fire resultater, og ett av disse bestemmer vi at er egnet for den videre utviklingen av storylinen.

Eneste problem nå er at bildet har fått en litt merkelig gultone. Dette er mye enkle å justere manuelt. Vi lagrer derfor bildet og tar det inn i Google Photos:

Justert versjon nedenfor:

Det er nok fremdeles mye som ikke er korrekt i dette bildet. Vi ønsker noe lavere åser, og ber om "I et dansk landskap".

Det sentrale i denne sammenhengen er imidlertid ikke å skape et 100% troverdig bilde. De bildene vi nå har kommet frem til så langt, kan fint plasseres inn i en nasjonaromantisk bildetradisjon. Denne var fremdeles høyst levende rundt år 1900 – i alle fall i Norge.

Vi ser at selv med enkle "prompts" kommer vi raskt frem til et fungerende, visuelt resultat. Her har vi ikke bedt om en bestemt visuell stil, og kanskje hadde vi litt flaks. 

I mange sammenhenger kan det være lurt å be om en visuell stil som ikke er fotografisk. Både fordi det i seg selv kan gi en tidskoloritt, men ikke minst fordi det gir en distanse til det universet som vi arbeider med i storylinen – vi ser det hele litt utenfra. Det passer med hensyn til sted, men når vi kommer til karakterene kan vi gjerne tillate oss å gå "tettere på", være mer subjektive, med mindre distanse.

Begge vesjonene inneholder konkrete bygninger, ulike objekter og personer. Dette hjelper oss videre, når vi skal utvikle "Miljø" og "Karakterer".

Copilot benytter Open AIs Dall-E 3. Med denne er det mulig å laste opp et bilde og be om ulike versjoner basert på dette bildet.

Vi ber om noen versjoner: "Kun en båt. En smie. Lavere fjell". Dette blir imidlertid ikke veldig vellykket.

Det kan være tilfeldigheter, eller ulikheter mellom den åpne versjonen av Dall-E og den som krever betaling.

I alle fall, en kort dialog med utgangspunkt i samme prompt blir vesentlig mer vellykket når vi forsøker direkte i Dall-E 3. Resultatet er et ganske troverdig bilde, i forhold til en situasjon i Norge for 150 år siden.

I fullversjonen av Dall-E 3 har en mulighet til å fjerne deler av et eksisterende bilde og generere nytt innhold for kun den markerte delen. Her forsøker vi å fjerne fjellene, og be om "Lave åser. I Danmark".

Det er umulig å vite sikkert hvorfor resultatet, til høyre nedenfor, minner så lite om et dansk landskap. Her kan vi jobbe videre med et mer spesifikt prompt, eller se litt nøyere på bildet. I dette tilfellet har nok KIen oppfattet refleksjonene i vannet, og laget landskapet i horisonten deretter.

Et nytt forsøk (nedenfor) blir bedre, men ennå ikke helt slik vi ønsker. 

Vi har trolig kommet til et punkt hvor det kan være bedre å benytte et program for å behandle bildet med mer tradisjonelle manipuleringsteknikker.

Manuell redigering

Her en verktøyet Pixlr.com brukt for å gjøre de siste endringene i bildet. Her hopper vi over detaljene, men kloneverktøy er brukt for å utvide skyer og refleksjoner. Horisonten er klippet ut og gjort lavere (presset sammen vertikalt), og deretter duplisert for å illudere refleksjon.

Til slutt står vi igjen med et bilde som kun har noen stilmessige trekk igjen fra Thomas Fearnley sitt maleri.

Samtidig har vi nå smien vår, arbeidsplassen som vår storyline skal kretse rundt. Rundt ligger et åkerlandskap, ikke langt unna en liten landsby/bygd, båten kan ta oss til et større sted, osv.

Med det kan vi ta tak i de som arbeider i smien, og de som kommer innom i løpet av en dag ...

Som en del av ideutviklingen kan vi høre hvordan KIen selv vil beskrive bildet:

Fra redigeringsprosessen (ovenfor) og et mulig resultat (nedenfor).

Karakterer

Her vende vi tilbake til Copilot, laster opp det redigerte bildet og ber om "Et bilde av smeden som arbeider her. Sort hvitt foto. Helfigur."

Alle disse alternativene kan fungere, men implisitt ligger noen valg med hensyn til smedens alder. 


Det visuelle valget bestemmer smedens alder, og kan dermed gi oss en retning for de andre karakterene som han møter i sin hverdag. Dersom vi ikke ønsker å være så spesifikk kan en gjerne be om et bilde i en enklere stil. F eks et bilde som ligner på et tresnitt. Dette er mer åpent for tolkning, sammenlignet med et bilde som ser ut som et fotografi.

Her er det første bildet, en yngre mann, tatt videre. Dette har også vært en tur innom Google Photos, og fått en varmere sepiatone.

Dette bildet kan eventuelt sette den visuelle stilen for flere bilder, av denne og andre karakterer. 

Vi kan velge å gjør motvet enda mer abstrakt. Her et eksempel laget med den åpne tjenesten Craiyon.com. Her har vi bedt om et bilde av en smed, i stil som legger seg opp mot et tresnitt av Edvard Munch.

Craiyon gir et mye mer upolert uttrykk. i noen sammenhenger kan det være interessant, f eks dersom en vil trykke motivet på andre bakgrunner.