Vizuální tvůrci versus AI

14. února 2024 Michael Petrus

Jako ilustrátor a art director jsem se vždy považoval za technologického nadšence. Tedy až do chvíle, kdy začaly AI nástroje jako Midjourney ohrožovat obživu mých kreslících kolegů a možná i mou.

Vizuální tvůrci versus AI

Následující text doplňuje podrobnosti a vizuální ukázky k mému rozhovoru s Robertem Vlachem o změnách, které dopadají na obor vizuální tvorby vlivem technologií umělé inteligence a dále je komentuji v tomto článku. Pokud si náš 5hodinový rozhovor pustíte celý, najdete v něm i hromadu dalších témat a odboček — k pivotování služeb na volné noze, mé práci ve studiu, k mému startupovému období, impostor syndromu, do popkultury, ale i k zamyšlení nad vizuálním oborem z vyšší a dlouhodobější perspektivy. Vaše komentáře na YouTube si rád přečtu a zodpovím i případné dotazy.

Přínos tohoto článku pro vaši práci bude hodně záviset na tom, jak moc toho už víte a kdy jej čtete. Za pár měsíců, natož pak let, budou některá tvrzení už zastaralá. Blesková rychlost charakterizovala v posledním roce a půl vývoj generativních modelů AI. I pro mě tak bude náramně zajímavé se na tento článek za pár let znovu podívat.

Na začátku byla vášeň

Vraťte se do svých začátků. Prvních pracovních gigů. Možná i lehce před ně. Proč jste vstupovali do oboru, ve kterém dnes pracujete? Co bylo tím koníčkem, tou vášní, pro kterou jste se rozhodli své kariérní kormidlo nastavit takovým směrem?

U mě to bylo kreslení. Kreslení komiksů. Nešlo jen o to vyprávět příběhy vizuální formou. Takovou, která mi byla nejpřirozenější od dětství. Ono šlo dost i o to dělat čáry, vybarvovat, stínovat. Ty tahy tužkou, fixem, štětcem a později stylusem pro mě byly nejen zábavou, ale také relaxací, možná i jakousi arteterapií.

Circa v 7 letech byly moje sešity plné střílení, ninjů, krve a mrtvejch. Myslel jsem si, že jsem vynalezl žánr akčního komiksu. Než jsem tedy zjistil, že Marvel a DC to, tehdá, dělají už skoro 60 let. Sci-fi, postapo a fantasy nezůstávaly pozadu.

Troufnu si říct, že jsem se od té doby posunul. I když spousta střílení, ninjů, krve a mrtvejch je tam pořád.

Legrační je, že už nějakou dobu intenzivně profesionálně nekreslím, takže ve skutečnosti svůj aktuální stav neznám. Píše se rok 2024 a já jsem demotivovaný kreslit a posouvat se v tom. Kvůli umělé inteligenci a jejím generativním modelům.

Lhal bych, kdybych to vše sváděl na AI. Kreslit na denní bázi jsem přestal už před lety. Od ilustrátora a komiksového kreslíře jsem se posunul více k art direkci, kreativě a produkci ve vizuálním oboru. To vše mám na starosti v našem kreativním studiu artBLOCK, kde zastávám roli creative directora. Pomáháme značkám odlišit se na první pohled skrze stavbu neotřelých vizuálních identit, kde hlavní přísadou jsou ilustrace, maskoti, animovaná videa, 3D a případné propojení vizuálů s technologiemi jako je AR, mobilní aplikace atp. Ostatně další větví studia je design a produkce vizuálů pro oblast vzdělávání, videoher nebo mobilních her.

Moje vyrovnání s nástupem AI

Jako řada mých oborových kolegů jsem procházel různými obdobími frustrace a uklidnění. Byla to taková sinusoida mezi dvěma extrémy „jsem v háji“ a „nic mi nehrozí“:

  • Červenec 2022 — Něco se začíná dít v kuloárech vizuálního oboru a AI na nás začíná vystrkovat růžky.
  • Září 2022 — Jsem demotivovaný k tréninku a vlastní tvorbě. Mám pocit, že moje práce a celkově obor končí. Začíná mi být jasné, že ekonomická rovnice „rychle, levně, v mnoha variantách a bez únavy“ je neúprosná.
  • Podzim 2022 — Nevím co bude, ale copywriteři jsou na tom hůř. Je mi smutno z budoucnosti oboru.
  • Zima 2022 — Ne. My vizuální tvůrci jsme v háji stejně jako copywriteři.
  • Začátek 2023 — „AI dýchánky“ s kolegy. Mapuji si proces své tvorby v perspektivě možného zapojení AI do svého workflow. Přihlašuji se k pravidelným odběrům novinek ze světa umělé inteligence.
  • Průběh 2023 — Pokračuji v mapování pole AI a implementuji ji do svého procesu tvorby.
  • Konec 2023 — Kolegové se shodují, že to tak horké nebude a já si tím nejsem jistý.
  • 2024 — dozvíte se v rozhovoru :)

Vzdor umělců

Na konci roku 2022 se zvedla vlna protestů No to AI generated images. Jistě, že některým umělcům šlo mj. o jejich autorská práva. Osobně se však domnívám, že vzdor vznikl a byl živený především strachem — strachem tvůrců ze ztráty sebehodnoty a jejich jedinečné pozice na trhu nebo v oblasti umění. Často to byl běh hlavou proti zdi a bez představy o tom, co se na poli AI skutečně děje.

Argumenty těchto tvůrců stály na ztrácející se autenticitě, úpadku kvality tvorby, degradaci lidské kreativity, porušování autorských práv nebo nebezpečí monopolu na tvorbu vizuálních děl. A ono to všechno je pravda a všechno to jsou aspekty, které trápí i mě. Problém byl, že se na věc dívali optikou současného stavu práva, technologických možností a potřeb klientů.

Největší hejt ze stran umělců/tvůrců padá na společnosti trénující své generativní modely na enormním objemu dat, které tak nějak “seškrábly” z internetu v určitém časovém bodě a na něm se učily. To ale znamená, že více či méně vykrádají větší množství autorských děl tím, že napodobuj jejich styl a obsah. Mohou tak porušovat autorský zákon. V masivním měřítku.

Tohle budou řešit soudy. Bude to dlouhé a těžko říct, kde to skončí. Zdá se, že by bylo pro tvůrce výhodnější, když soudy dají za pravdu autorům a AI modely by se musely trénovat od začátku znovu na datech, ke kterým budou mít práva. Úprava autorského zákona pro poskytnutí volnější možnosti AI modelům učit se na jakýchkoli datech pro následné beztrestné komerční užívání jejich výstupů se nyní zdá spíše nepravděpodobná.

Ve světě a hlavně v USA se rozjela spousta soudních řízení se společnostmi, které trénují modely pro generování obrázků. Také se začaly objevovat žaloby na konkrétní umělce využívající AI s tím, že se v jejich generovaných dílech objevily rysy cizích děl s nepřiznanou inspirací, nebo že vydávali AI díla za svá originální, autorská. Kvůli nedostatečné transparentnosti zdrojů trénovacích datasetů je obtížné určit, zda jsou výstupy z AI výsledkem právě porušení autorských práv, nebo zda jde o náhodu.

Artstation, což je jedna z největších portfolio platforem na poli ilustrace, concept artu a designu, si prosadil povolení používání AI v procesu tvorby. Odstraňoval posty „No to AI“ a obhajoval to porušením podmínek platformy. Adobe a další implementovali opt-out (tedy možnost zamezit učení se na dílech, se kterými v daném softwaru pracujeme). Dnes se situace trochu uklidnila. Lidé pochopili, že právo i kreativní trh se budou s nástupem AI vyrovnávat delší dobu.

Je AI kreativní? A jsme my?

Zkuste si zodpovědět otázku, zda jste opravdu kreativní. A nemyslím teď to, že pracujete v kreativním oboru jako je grafický design, ilustrace, copywriting, hudba, architektura, fotografie, 3D, móda, webdesign, filmová tvorba a další. Přesto, že jsou tyto obory označovány za kreativní, často jsme někteří z nás „jen“ řemeslníky. Já označuji tyto řemeslníky ve vizuální tvorbě v kontextu AI za „lopaty“. A vůbec to nemyslím zle. Já byl spokojená lopata dlouhé roky. Ono to zkrátka dobře vystihuje kontrast se skutečnými kreativci či designéry.

Nebudu se teď vůbec zaměřovat na jazykové modely, protože i když je využívám, psaní je pro mě přece jen vzdálenější obor. Pojďme si ty dva pojmy rozebrat na příkladech z řad ilustrátorů:

Lopata je takový ilustrátor, který třeba perfektně ovládá kreslení technicky. Má natrénovanou lidskou anatomii, fungování světla a stínů, barevnou teorii, perspektivu. Umí třeba hyperrealisticky ztvárnit člověka do portrétu. Umí kreslit organické i technické objekty. Přírodu, vozidla, architekturu a další. Ale tam to končí.

Skutečně kreativního ilustrátora však může definovat mnohem víc. Třeba vždy nemá 10.000 hodin v kresbě anatomie a jiných stylech kreslení, ale zvládá je dostatečně dobře. Jeho přidaná hodnota je však např. i storytelling, konceptování a designování (tedy funkční řešení problémů). Nemusí jen napodobovat, ale i sám tvoří nové. Zvládne jistou úroveň udávání výtvarného směru projektu a nenásleduje jen zadání od druhých. Samozřejmě je super, když takovýto tvůrce zvládá ještě víc a má např. přesahy do grafického designu, typografie, animace, kaligrafie, 3D a dalších řemesel. Umí se napojit na klienta, zamýšlet se nad jeho problémem a najít pro něj řešení pomocí svého řemesla. Ale to už je opravdu role art directora. Pojďme zpět ke kreativitě.

Co je tedy kreativita? Existuje pro ni mnoho definic a obšírných popisů. Mě celkem baví jednoduchá definice popsaná California State University v Northridge, kde jsem zvýraznil slova, kterými jsem si definici pro své potřeby zestručnil.

Kreativita je definována jako schopnost vytvářet nebo rozpoznávat nápady a alternativy nebo možnosti, které mohou být užitečné při řešení problémů, komunikaci s ostatními a zábavě sebe i ostatních.

Zastávám názor, že většina dnešní tvorby, kterou můžeme ve světě a na internetu najít, je pouze kombinací a variací na dříve vytvořené. Zkrátka za život si my, vizuální tvůrci, vytváříme nějakou „vizuální banku“ — set obrazů, které si pamatujeme v hlavě, zakládáme do desek nebo ukládáme na pevný disk. Tuto vizuální banku pak při tvorbě kombinujeme se svou osobní unikátní zkušeností (co nás baví, na co se zaměřujeme). Při řešení specifického problému ji ideálně dále doplňujeme o reference, které si v rámci rešerše dohledáme na míru zadání. To vše pak kombinujeme a variujeme, až vznikne cosi více či méně „originálního“.

No a co dělají právě ty difuzní modely generující obrázky? Kombinují a variují vstupy ze svého trénovacího datasetu = obrovské vizuální banky. Během tohoto procesu se model učí rozpoznávat a reprodukovat složité vzory, textury a vztahy v datech, což mu umožňuje generovat nové obrázky, které vypadají přirozeně a jsou vizuálně přitažlivé, ale zároveň odlišné od jakéhokoli konkrétního obrázku, na kterém byl model trénován. (Záměrně to hodně zjednodušuji.) Znamená to, že jsou kreativní jako většina z nás? Nebo to znamená, že většina z nás vlastně není?

Myslím, že není důležité se tím trápit. Důležité je a bude, že pokud děláme v oboru, který se označuje za kreativní, budeme muset umět řešit problémy našich klientů. To je teď nejdůležitější si uvědomit pro nás všechny, kdo chceme v oboru prosperovat.

Aktuální stav

Bez přehánění. To, co platí dnes, nemusí platit zítra.

Proč vlastně používat AI a nespolupracovat s člověkem? Protože jaký je zájem klienta, když poptává vizuální služby? Udělat to rychle, levně a ve velkém množství/vysoké kvalitě. Osvícení klienti mají rozhodně rádi kvalitu, ale i kreativitu a funkčnost. Čas i peníze nemusí být tak zásadními faktory. Tu rychlost, nízké náklady a množství AI snadno v budoucnosti nahradí. Na kvalitu, kreativitu a funkčnost se musíme zaměřit, pokud chceme prosperovat.

Někdo AI zcela neuznává a považuje ji za apokalyptický nástroj kreativního světa, někdo zase s AI žije v symbióze. Jsou tvůrci, kteří užívají k tvorbě výhradně AI. To by ještě bylo za určitých okolností v pořádku. Věřím, že budou „AI umělci“, „AI directoři“ nebo „AI operátoři“. Vlastně už jsou. Někteří to dělají skvěle. Tihle tvůrci mohou poskytovat vysoce odbornou službu. Lidé, kteří rozumí designu, mají vytříbené estetické cítění a dokonale ovládají umění promptu. Ti, kteří ale moc nepřispívají svou čistě AI generovanou tvorbou, jedou spíše na vlně AI klišé. Bez myšlenky, bez stylu. S výstupy někdy příliš sterilními nebo vzhledem i pro laika zřetelně vygenerovaným obsahem. Možná ale i tahle skupina je důležitá pro to, aby se mohlo v takovém kontrastu jasně oddělit zrno od plev. Ostatně tak, jak tomu bylo u dosavadní tvorby. Takže nakonec se nejspíš vracíme opět k té často skloňované myšlence, že AI skutečně je jen další nástroj pro lidi a záleží na tom, kdo jej užívá, pro co a jak. Další, avšak převratný nástroj.

Co aktuálně pozoruji na poli vizuální tvorby (začátek roku 2024):

  • Někteří začínající tvůrci jsou demotivovaní k získávání skillu. Někteří profesionálové k dalšímu růstu.
  • Mám obavy o obor, jeho další vývoj, o motivaci začínajících tvůrců a degenerování některých schopností lidí (což je možná pro další vývoj jen přirozený jev a správný směr).
  • Začínají se objevovat smysluplné nástroje navržené tvůrci pro tvůrce. Některé dostávají funkční grafická uživatelská rozhraní. Rychlosti generování a velikosti výstupů začínají dávat smysl. Zvlášť velký užitek pak vidím v nástrojích s real-time generováním.
  • Nástroje urychlují některé činnosti profesionálů, jako je retušování, photobashing, tvorbu moodboardů, hledání inspirace, vektorizování, upscalování, tvorba assetů atp.
  • Podprůměrní a začínající ilustrátoři ztrácejí práci a jsou nahrazováni v jednoduchých úkolech umělou inteligencí. Např. tvorba jednoduchých ilustrací pro příspěvky na sociální sítě, blogy, vizuály newsletterů, portréty, skici s úkolem vizualizovat jednoduché fyzické objekty atp. Nebo to, co není problém si pro laika s jednoduchým promptem vygenerovat v ucházející kvalitě.
  • Avšak i hodně zkušených ilustrátorů kreslilo pro reklamní agentury storyboardy, různé situační kresby a jiné vizualizace nápadů, které později sloužily pro další kreativce jako odrazový můstek. Ti ztrácejí práci tak rychle, jak jsou agentury schopné adoptovat AI ke svému užitku. Ostatně i naše studio už dnes běžně dostává od klientů jejich nápady vygenerované v AI. Jsou dobré? Ne. Nenesou tu správnou myšlenku a další aspekty potřebné ke splnění účelu. Stačí k tomu, abychom jako zkušení tvůrci pochopili, o co klientovi jde? Ano. Rozhodně je od čeho se odpíchnout dál.
  • Lidé si generují jednoduché vizuální dárky, které by dřív nechali tvořit umělce a kde neočekávají uměleckou hodnotu. Zkrátka jim to tak stačí.
  • Komplexní designová řešení jsou a budou ještě nějakou dobu dominantou lidí. Např. tvorba kvalitní ilustrace vizualizující abstraktnější koncepty, vizualizace principů a schémat, tvorba komiksu, animovaná videa, tvorba loga, UX/UI, komplexní design systémy jako je stavba vizuální identity značky, vytvoření kampaně nebo vývoj videohry, animování filmu, VFX. Všechny tyto typy tvorby už dnes v najaké míře můžou být zpracovány umělou inteligencí, ale s profesionální zkušeností odrážející se na její kvalitě, se to srovnat (zatím) nedá.
  • Generování assetů se stává běžnou součástí procesu tvorby vizuálů mnoha early adopterů a často výrazně zvyšuje jejich efektivitu práce. (Poznámka: V oblasti vizuální tvorby se pod pojmem „asset“ rozumí jakýkoliv prvek používaný při produkci digitálního obsahu. Mohou to být obrázky, 3D modely, animace, zvuky, hudba nebo dokonce kousky kódu.)
  • Zadavatelé z řad uměleckých vedoucích a produkčních stále preferují tvorbu lidí a práci s nimi. Ovšem zkracují a zlevňují konceptuální a pre-produkční fáze svých projektů právě díky AI.
  • Zadání problému, jeho pochopení a vymyšlení skutečně funkčního řešení je stále mnohem snadnější s člověkem s jeho lidskou a odbornou zkušeností.
  • Garancí kvality vizuální tvorby zůstává dobré kreativní zadání sestavené zkušenou osobou a kurátorování následných výstupů.

Je mi smutno z toho, že naše krásné ilustrátorské řemeslo možná zanikne tak, jak ho známe. Možná bude kreslení „jen“ koníčkem nebo výsadou umělců. My ilustrátoři ale nebudeme první ani poslední. Možná jsem jen nostalgický. Vždyť mám rád pokrok a technologie. Pracovně se už delší dobu cítím dobře v roli toho, kdo vymýšlí řešení, dohlíží na realizaci a není řemeslníkem. Nedělám hezké obrázky, řeším klientům byznysové cíle pomocí vizuální tvorby.

Změna mého procesu

Tady se připravte na trochu nerdovství. A vězte, že já jsem spíš ještě mainstreamák oproti těm skutečným AI nerdům, kteří používají ještě o dost pokročilejší nástroje nebo postupy než já. Naštěstí ve studiu už i takového máme.

Jak už bylo řečeno, neživím se už tím, že kreslím obrázky. Proto i následující body jsou součástí mého procesu creative/art directora při tvorbě komplexnějších projektů v různých oblastech.

AI používám ve své práci denně. V tvorbě pak následovně:

  • Perplexity — rešerše na internetu
  • ChatGPT — ideace, brainstorming, tvorba asociací do konceptů a kreativních zadání, zpětná vazba a coaching, brainstorming pro tvorbu přednášek; doplňuji to úpravou textu, hledáním názvů atp.
  • Midjourney — tvorba ilustrací a grafiky do konceptů, moodboardů, pitchů nebo tvorba vizuálních referencí do kreativního zadání pro můj tým; tvorba assetů
  • Krea.ai — skicovování kombinaované s real-time generováním, když mám přesnější představu, kterou mohu pro AI naskicovat
  • Topaz Gigapixel AI — upscalování grafiky nebo výstupů z generátorů
  • Leonardo.ai — úprava detailů výstupů z jiných AI
  • ElevenLabs — tvorba voiceoveru do animatiků nebo animovaných videí
  • Photoshop generative fill — cokoli dnes a denně v oblasti dotváření a čištění grafiky a fotek
  • Více popisuji v přednášce na konferenci o AI, nazvané Pravidla se změnila (35 min)

Jeden jednoduchý příklad za všechny: Většina klientů postrádá dostatečnou představivost a nebo si zcela přirozeně nedokáže představit obrazy něčeho komplexního, co je popisované v textu. V projektu níže jsem potřeboval klientovi ukázat mockup produktu ve fázi konceptu, jak by asi mohl vypadat s ilustrací. Protože byla ale fáze konceptu omezená rozpočtem i časem, bylo vhodné použít AI.

Takto tedy vypadla část konceptu, kde jsem použil AI generát pro ilustraci. Promítl jsem tam barvy, styl i základ obsahu. Detaily jsme v té chvíli ještě neznali. Níže pak finalizace etikety, která vznikla později po průchodu další explorací.

Mimochodem proces tvorby generování obrázků je především založený na iteracích v rozsahu násobně větším než při práci s lidským tvůrcem, který mnohem rychleji pochopí záměr. Tady je ukázka toho, jak jsem si chtěl rychle ( :D ) vygenerovat vizuál pro tento příspěvek na LinkedIn.

Midjourney řadí obrázky od nejnovějšího, ukázku tedy prohlížejte odspoda:

O jiném a rovněž zajímavém procesu „brute force“ iterací si poslechněte můj rozhovor s Danielem Špačkem na Kreativních Kreaturách z první poloviny roku 2023.

Co mě limituje při užívání AI k tvorbě vizuálů?

  • Nekonzistence stylu/obsahu
  • Halucinace a chyby, které jsou pro AI běžné a člověk by je častokrát snad ani nemohl udělat (např. nástroj je držen špatně nebo levituje mimo ruku)
  • Nikoli uvěřitelný detail
  • Slabá přirozenost a uvěřitelnost na základě reality (i ty nejběžnější věci působí divně)
  • Omezená kontrola nad generováním a úpravami vygenerovaných obrázků
  • Absence možnosti zadávat tvorbu přirozeným jazykem u většiny nástrojů (ChatGPT to umí pro DALL-E, ale ten nemá výsledky, které očekávám)
  • Absence zadávání komplexním multimodálním vstupem (např. nahrát brief s textem, referencemi, odkazy a obrázky)
  • Nízký výkon nástrojů, tj. nízké rychlosti a malé počty generovaných výstupů na jeden požadavek
  • Současné editovací nástroje, absence vrstev a nedestruktivních metod (některé nástroje s primitivnějšími modely to už umí, např. Recraft.ai)
  • Photoshopácký generative fill je dobrý na fotku, ale selhává pro většinu kreslených stylů, které jsem zkoušel
  • Slabá kvalita trénování vlastního modelu jednoduchým způsobem (viz níže)
  • Omezení komerčního užití generovaných děl v kontextu možného porušování autorských práv

Věřím, že většina výše vypsaných věcí bude dříve nebo později vyřešena. Limitace užívání je pro mě tedy, hádám, spíše dočasná.

Trénování vlastního modelu — Celkem užitečné může být pro tvorbu „natrénování si vlastního modelu“, který potom lze užít pro další generování obrázků, většinou pomocí Stable Diffusion modelů. Co to trénování vlastně znamená?

Existují nástroje, do kterých vložíte určité množství obrázků relevantních pro požadované výstupy. Může jít o jejich obsah, o jejich styl nebo obojí dohromady. Podobně fungují např. portrétové aplikace, kam nahrajete set svých portrétových fotek a aplikace vám pak umožní svůj obličej generovat v různých variacích a stylech. Pro mě osobně bylo zajímavé zkusit lokálně natrénovat styl, který užíváme ve studiu artBLOCK. Říkal jsem si, že by nám to někdy mohlo pomoci urychlit nebo usnadnit práci v různých fázích procesu. Vložili jsme tedy do nástroje set obrázků v jednom konkrétním stylu. Šlo o portréty, postavy, interiéry, architekturu… zkrátka co nejpestřejší set. Níže vidíte výsledek.

Ukázky originálních vložených obrázků (práce našeho studia).

Zde jsou generáty z natrénovaného modelu. Model je velice nedokonalý, co se detailů a přesnosti linky týče. Je hodně omezený jen na to, co zná. Což je vidět na postavách a jejich obličejích, i na interiéru, který je značně nenápaditý. Je tam řada chyb, které by zkušený ilustrátor neudělal.

Zadání pro AI znělo „Hi-tech sci-fi robot“. Co vidíte níže, snad ani nemusím komentovat.

Trénování vlastních modelů je také oblast, která se posouvá a zlepšuje. Opět je to pro většinu mé práce zatím ale nepoužitelné. Jistě přijde doba, kdy trénování půjde udělat i z menšího datasetu a výsledky budou výborné.

Dosáhnout některých detailů (nejen vizuálních, ale i technických) může být velice komplikované, nejen při pokusech užití vlastních natrénovaných modelů. A stejně tak i časově neefektivní. Někdy výstupy nedávají smysl, někdy to nevypadá dobře. Tady je vhodnější nakombinovat to s ruční tvorbou a dotáhnout pomocí postprocesu tradičně — to ale může být složitější než celý vizuál udělat postaru „made by human“. Možná to pokrok v budoucnosti vyřeší. Ještě to tam ale nějakou dobu nebude v té rovině, kterou bychom si my, lidé od fochu, představovali.

Zkrátka chci kvalitní, silný, rychlý, multimodální all-in-one nástroj. Takový, který bude navržený s intuitivním uživatelským rozhraním pro práci profesionála ve vizuálním oboru.

Autorský zákon

Proč nenasazuji vizuály generované pomocí AI na ostré použití? Práva — zásadní problém drtivé většiny nástrojů na generování (těch s nejlepšími výsledky).

U následujících bodů vycházím z toho, jak rozumím aktuální právní situaci po konzultaci s advokátkou Petrou Dolejšovou, která se touto problematikou zabývá. Rozhovor s Petrou na toto téma najdete také na Kreativních Kreaturách. Já právník nejsem, pokusím se to pouze shrnout.

Vše, co vygenerujeme, můžeme dále legálně prodat svým dále klientům. Hurá! ALE pouze bez veškerých práv k užívání. To, co vygeneruji, není autorské dílo a nemůžu klientovi zaručit, že užívání takové grafiky nebude pro jeho účely do budoucna problematické z hlediska porušení autorských práv jiných subjektů.

  • Autorem může být jen člověk (ne zvíře, ne software, ne AI nástroj).
  • Cokoli, co vygeneruje AI, není autorským dílem, nemůže být licencováno a není možno k tomu poskytnout výhradní práva. Je to v public domain. To mohou tvůrci řešit tak, že nesposkytnou výhradní licenci a klient může takový výstup užívat „na svoje triko“. Je ovšem nutné jej na to upozornit dopředu a probrat všechny související výhody a nevýhody, včetně jasného vymezení zodpovědnosti.
  • AI nástroje a užití jejich generátů může zapříčinit porušování autorských práv z podstaty toho, jak se nástroje učily tvořit — přes trénovací dataset obsahující i díla autorů, kteří nedali souhlas s užitím jejich děl pro trénování. Jiné to je u subjektů, jako je např. Adobe, které tvrdí, že má práva na obsah svých trénovacích datasetů. Podobně to má ElevenLabs, u kterých jsem generoval AI voice over do videa. Zkrátka si pomocí AI technologie a vstupu zaplacených dabérů vytvořili své modely. Zcela legálně. Některé nástroje budou dál porušovat práva, budou platit pokuty a vyplatí se jim to. Jiné se uvážou k úhradě výloh za soudní řízení a případné škody, které můžou způsobit vámi vygenerovaná díla… a asi se jim to vyplatí také. Doporučuji, vybírejte své nástroje podle svého nejlepšího svědomí.
  • Naopak Midjourney má dnes ve svých podmínkách užívání, že tvůrce nemá porušovat autorský zákon užíváním výstupů z jejich nástroje. Pokud bude mít Midjourney z tohoto důvodu právní problémy a výdaje s tím spjaté, bude je požadovat po tvůrci, který svým chováním problémy zapříčinil.
  • Ochrana osobnosti, osobních údajů a další citlivé údaje mohou být také problém, protože modely jsou jistě naučené např. i na našich fotkách, které máme volně dostupné na internetu. Pro jednoduchý příklad si asi umíte představit, jak skvěle umí Midjourney dělat obličeje celebrit, jejichž fotek je plný internet.
  • Do smluv je nutné zapracovat body ohledně užívání (nebo neuživání) AI.

Mimochodem v lednu 2024 proběhl první rozsudek v ČR, jehož verdiktem bylo, že posuzovaný generát není autorským dílem.

Užití AI bez rizik

Doporučuji každému tvůrci, který AI využívá nebo chce využívat a následně prodávat svým klientům výsledky její práce, aby svůj specifický případ probral s právníkem, který se tímto tématem zabývá.

Níže popíšu, jak jsem problematiku užívání vizuálů generovaných pomocí umělé inteligence pochopil po konzultaci s odborníky já a kdy je podle toho možné takové generáty užít bez rizik.

  • Pro generování využíváte nástroje, které veřejně deklarují, že drží plná práva k trénovacím datům svých modelů.
  • Výsledek vám slouží jako asset — malá část nebo části díla, které spojujete a dále upravujete natolik, že jejich použitím a následným procesem tvorby vytváříte zcela nové dílo. Mimochodem, kde je ta hranice, co je nové dílo a co je pouze nějaký derivát nebo kopírování části, je dost ošemetná. V různých zemích se to posuzuje dle zákona jinak. Každý soudce to může také hodnotit jinak. Nicméně se takto v mnoha kreativních oborech pracuje dnes a denně.
  • Se svým klientem jste se dopředu dohodli, že používáte k vytvoření vizuálu AI a upozornili jste ho, že mu nemůžete poskytnout výhradní práva a že zároveň vizuál může v budoucnu porušovat práva jiného autora nebo subjektu, který je drží. Dobré je do smlouvy doplnit, že za porušení práv při užití nenesete žádnou zodpovědnost, pokud by takovým způsobem vznikala klientovi nějaká škoda a že na to byl klient dopředu upozorněn. Zcela upřímně: V mnoha užitích je ta pravděpodobnost žaloby tak malá, že je velké procento klientů ochotno takové riziko v klidu přijmout.

Může být generát autorským dílem v budoucnu? Pokud na začátku bude silný kreativní vstup od člověka, tak nejspíš ano. To ale ukáží následující roky. Podmínky pro vznik takového autorského díla pod taktovkou člověka-kreativce si představuji následovně. Budete mít nosnou úvodní myšlenku. Na jejím základě vytvoříte, nejspíše formou několika iterací, dostatečně specifický a vyprecizovaný prompt nebo textové zadání včetně referenčních obrázků či jiných mediálních referencí. Zkrátka jako když se tvoří velice přesné kreativní zadání. Co myslíte? Věřím, že většina lidí pracujících s AI (kteří ví, že vytvořit přesný výsledek odpovídající jejich původní myšlence je fakt dřina) by souhlasila. Zda takový výsledek může být autorským dílem, o tom rozhodnou v budoucnu soudy. To nejspíše potrvá roky. U fotoaparátu se udělala vyjímka v autorském zákoně. Možná bude dalším adeptem na vyjímku právě AI.

Tipy na užitečné nástroje

Následující nástroje jsou výběrem těch nejužitečnějších, které používám nejčastěji a které mohou být k užitku i vám.

Můj základní dennodenní balíček

  • Adobe Photoshop generative fill — Photoshop používá neurální filtry už léta, ovšem generativní výplň je nástroj, který opravdu posouvá každodenní tvorbu na novou úroveň, především v oblasti fotografie nebo abstraktnější grafiky, textur apod.
  • Midjourney — jeden z předních generátorů obrázků, které jsou velice estetické po všech stránkách (barvy, kompozice, design, „kreativita“)
  • Topaz upscaler od Gigapixel — jeden z nejkvalitějších upscalerů obrázků
  • ChatGPT — je třeba ho popisovat?
  • Perplexity — takový ChatGPT kombinovaný s prohlížečem, vytuněný pro tvorbu rešerší a zodpovídání dotazů prostřednictvím internetu
  • AI v Notionu — copilot, který vám pomůže přemýšlet, psát, ale i formátovat Notion obsah

Pokročilejší tvorba nebo specifický úkol

Existuje ještě pěkná řádka nástrojů např. pro tvorbu 3D grafiky. I když se 3D v našem studiu pracujeme, není to těžiště mé tvorby, a proto je nemám ani prozkoumané. Patří mezi ně generátory modelů, scén, rigování, animace, tvorby assetů do videoher i 3D animací. Vizualizace simulující 3D se dají dobře udělat v jakémkoli generátoru obrázků za použití správného promptu stylu.

Další nástroje, do kterých někdy potřebuji zabrousit, pokud nedostávám ty správné výsledky nebo potřebuji vyřešit specifický úkol — DALL-E 3 (v rámci ChatGPT), Adobe Firefly, Upscayl, MacWhisper, Recraft.ai, Relume

Další nástroje, co často rádi používají kolegové — Stable Diffusion modely v různých UI variantách, Stable Diffusion Video, Layer.ai, Spline, Luma Genie, Vizcom, AI v Adobe Illustrator, Synthesia, AI v Canvě, ClipDrop, Visual Electric, tldraw, Google Gemini (dříve Bard), Bing, Claude, Poe, HARPA.ai a mnoho dalších.

Výhledově věřím, že budou existovat aplikace pro profesionály, jejichž jádrem bude generování pomocí AI, něco jako je Midjourney v pokročilejším uživatelském rozhraní. Často budou kombinovat více dílčích AI nástrojů. Dnes to dělá např. Leonardo.AI, které obsahuje generování obrázků pomocí mnoha modelů, tvorbu na generovacím plátně, real-time generování, včetně real-time kreslicího podkladu, trénování vlastních modelů, generování pohybu a generování textur. Potom budou nástroje, které budou obsahovat jednu primární funkci jako dnes. Dejme tomu nějaký kreslící software. Ovšem jeden z hlavních rysů bude AI technologie pod kapotou, která bude v procesu kreslení generovat části, na které bude tvůrce průběžně navazovat, generovat, navazovat atd. V neposlední řadě vzniknou nástroje, které budou AI technologií prošpikované. To bude ostatně většina aplikací, které jsme dnes zvyklí používat. Budou obsahovat AI nápovědu, chytré přizpůsobování uživatelského rozhraní nebo asistenta, který bude práci zrychlovat. Zajímavé také bude lokální zakomponování AI přímo do hardwarových zařízení.

Mimochodem. I přesto, že rozumím všem benefitům používání jazykových modelů pro psaní e-mailů, osobně ChatGPT pro tyto účely nevyužívám. Proč? Věřím, že jsem za těch 16 let mé kariéry dával značný důraz na zlepšování se v oblasti komunikace. Záleží mi na charakteru své komunikace. Chci být co nejvíc autentický, chci rozlišovat nuance v pochopení a řešení problému, chci dávat ten nejlepší servis svým klientům. Číst mezi řádky. Vnímat tohle všechno v lidské rovině by mi používání AI nástroje pro shrnutí e-mailů nebo generování odpovědí nedovolilo. Možná se to v budoucnosti změní.

Zajímavým nástrojem může být ještě např. AI or Not. Nástroj, který analyzuje nahraný obrázek a vyplivne pravděpodobnost s jakou je vytvořený pomocí AI, nebo člověkem. Glaze je pak nástroj pro umělce, který má u obrázků znemožnit čitelnost pro generátory, aby se nemohly na takto upravených obrázcích trénovat. Glaze má tak řešit strach, že někdo bude učit jiné modely na vašich dílech a tím porušovat vaše autorská práva. Nicméně na každý nástroj se dá vyvinout nástroj jiný, který ho zase obchází. Uvidíme, kam se celá tahle oblast posune.

Jak obstát ve věku AI jako kreativní tvůrce

Možná přemýšlíte, jaké tedy vlastně máte místo na poli kreativního průmyslu v době AI. Zamyslete se nad dvěma následujícími oblastmi:

Servis — Možná jste rozpolcení rozhodnutím, zda být spíš specialistou, nebo generalistou. Možná přemýšlíte nad tím, jakým způsobem si nadesignovat své služby. To bych si teď netroufl úplně doporučovat. Určitě v tom všem ale bude hrát velkou roli servis. Péče o klienta. Přemýšlení za něj. Vysoká kvalita komunikace, empatie a skutečného zájmu o pomoc s řešením jeho problému. Jasně. To vše bychom měli jako profesionálové dělat už dnes, že? Ruku na srdce. Kolik energie do těchto oblastí během zakázek dáváme? Jak moc se v těchto oblastech vzděláváme a aktivně sami rosteme?

Přesahy a osobní unikum — Pro kontext se podívejte na myšlenkovou mapu níže. Prosím vás, ta mapa nepopisuje mé silné a slabé stránky. Ani nepopisuje všechny dovednosti, na které mám certifikát. Je to jen zmapování, jak vnímám všechny své zkušenosti, které jsem nabyl prací pro různé projekty a klienty. Zahrnuji do toho, co jsem se naučil jako freelancer, jako spoluzakladatel umělecko-technologického startupu, jako tvůrčí hlava kreativního studia, jako mentor kreativních volnonožců atp. Vypsal jsem tam vše, co mě napadlo. Možná něco zapomněl. A ano, když si to takto sepíšete, působíte sám na sebe jako Brouk Pytlík. Natož pak na ostatní.

Proč sem tu myšlenkovou mapu dávám? Něco takového vám může hodně pomoci uvědomit si, čím vším jste za svou kariéru prošli, jaké zkušenosti jste nabyli a kde je vaše přidaná hodnota. Možná i co je unikátní kombinací vašich dovedností a zkušeností, které můžete na kreativním trhu svým klientům nebo zaměstnavateli nabídnout. Já zvolil myšlenkovou mapu, ale může to být jakýkoli jiný soupis. Forma je na vás.

Z toho si potom můžete nadesignovat služby, které nabízíte. Pro mě je to takový neustále živý proces, který ladím. (Aktuální podobu mých služeb najdete na mém webu; jejich složení se značně posunulo.)

Moje predikce

Změna průmyslu — V následující dekádě se vizuální průmysl otřese v základech a zcela změní přístup k procesu tvorby.

Demokratizace tvorby obrázků — všude kolem nás se bude objevovat mnohem více vizuálního balastu, laické tvorby, jednorázového obsahu a neodborných vizuálních výtvorů typu „urob si sám“.

Změna požadavků na tvůrce — Budou se proměňovat role a poměr mezi kreativci, designéry a výtvarnými řemeslníky („lopatami“):

  • Pro „lopaty“ pak bude zásadní roli hrát odborná zkušenost, velice distinktivní styl a tvorba na vysoké úrovni. Alternativně si mohou ke své vysoké odbornosti osvojit práci s AI nástroji a naučit se je perfektně ovládat nebo kombinovat se svým dosavadním tvůrčím procesem.
  • U kreativců a designérů pak půjde o znalost AI možností, schopnost doporučovat a vybírat řešení, zadávat tvorbu, kurátorovat výstupy a samozřejmě řešit problémy kreativní cestou jako doposud.
  • Odborná mezilidská komunikace bude stále stejně důležitá a zásadní. Komunikace se zadavatelem, týmová komunikace mezi zúčastněnými tvůrci i mezi relevantními odděleními pracujícími na projektu.

Nutné inovace — Kdo neinovuje, v oboru skončí a nebo to bude mít opravdu hodně těžké. Alternativně musí pivotovat služby tam, kde AI nebude v procesu standardem nebo nutností.

Úprava procesu — Proces se bude měnit. Bude implementovat AI kreativními způsoby. Takový proces může být důležitým know-how tvůrců budoucnosti.

Umění — Umění neutrpí tolik, jako užitá tvorba:

  • Lidé stále budou chtít uměleckou hodnotu ztvárněnou živým autorem, fyzický obraz, příběh, zážitek, podpis na plátně. Budou chtít živé celebrity (a to platí i pro film, hudbu nebo YouTube). Průvodním jevem však bude, že spousta umělců skončí a budou se více rozevírat nůžky mezi originálními nebo výrazně odlišitelnými umělci a těmi průměrnými.
  • Bude se rozšiřovat i odnož „AI umění“ a bude stejně relevantní jako každé jiné.
  • Do popředí se budou dostávat mnohem víc i jiné typy umění než ty přímo sousedící s výstupy AI nástrojů, jako je literatura či vizuální tvorba.

Servis — Ještě důležitější bude individuální přístup, perfektní servis, autentická komunikace, osobní setkávání (online i offline). Být více člověkem, učit se empatii, konverzaci, kvalitní komunikaci, pochopení, dokázat se pro projekt nadchnout, mít upřímný zájem pomáhat, chtít lidský kontakt… obyčejné věci.

Pokročilé systémy řešení — Umím si představit komplexní řešení marketingových a jiných problémů kombinující multimodální přístup, který nebude vyžadovat člověka a nebo ho bude využívat jen k jednoduchému zadání a schvalování výsledků během dílčích fází procesu tvorby. Tady se pravděpodobně nebavíme o následujících jednotkách let. Alespoň co se týče profi tvorby na úrovni.

Nové služby — Zajímavé může být trénování modelu (styl, obsah dle vizuální identity) a prodej takového modelu včetně promptů přímo značce. Taková značka si pak může generovat vizuální obsah sama.

…a nebo také nic z toho :)

To jediné, co si odnést

Jste zmatení? Jste demotivovaní? Dejte si čas zamyslet se, proč jste do vašeho oboru vstupovali. Co byla ta vášeň? Je vaše současné řemeslo tou vášní? Nebo jen nástrojem k tomu vaši vášeň realizovat? Pokud je jen nástrojem, objevil se vám tu parádní parťák, který pomůže realizovat dříve nemyslitelné.

Neremcejte, nezoufejte, nebuďte tvrdohlaví. Nemusíte ze dne na den změnit styl své práce nebo se zcela rekvalifikovat. Registrujte se do AI nástrojů nebo si je předplaťte a tvořte. Alespoň pro začátek.

„Práce je hotová a klient je spokojený. Proč si umělci a kreativci myslí, že všechnu práci musí udělat sami? Pokud se od toho dokážeme oprostit, může se stát spousta krásných věcí.“
Chris Do, designér, držitel ceny Emmy, zakladatel společnosti The Futur

Držte si svou unikátní osobní zkušenost. Pěstujte zájmy, koníčky, své přesahy. Z toho vznikne jedinečná kombinace, která vás jako profesionály odliší.

Ať už budete využívat AI více či méně, nejdůležitější v nadcházejícím věku pro vás bude nejspíš něco mnohem jednoduššího. Být více člověkem. Buďte empatičtí, dbejte na konverzaci, kvalitní komunikaci, pochopení. Ukazujte své zapálení, upřímný zájem. Preferujte čas od času lidský kontakt. Pomáhejte.

Obyčejný lidský věci.

Poznámka redakce: Tématu AI se podrobně věnují i další rozhovory v našem podcastu s Janem Romportlem, Milošem Čermákem a Davidem Grudlem:


Sdílejte
a diskutujte

Facebook Twitter LinkedIn Instagram

Odběr newsletteru

Odebírejte nejdůležitější novinky ze světa podnikání na volné noze. Každý měsíc zdarma ve vašem emailu:

i

Ochrana soukromí: Váš email bude zachován v tajnosti a nebude nikdy nikomu poskytnut. Odběr můžete kdykoli ukončit pomocí odkazu na konci každé zprávy.

Newsletter

Nejdůležitější novinky ze světa podnikání na volné noze.
Každý měsíc zdarma ve vašem emailu:

Ochrana soukromí: Váš email bude zachován v tajnosti a nebude nikdy nikomu poskytnut. Odběr můžete kdykoli ukončit pomocí odkazu na konci každé zprávy.

200+ top zdrojů, které sledujeme za vás
Pro freelancery i ostatní podnikatele
Široký záběr ve správném kontextu
Exkluzivní obsah a úvod v každém vydání
Od roku 2009 nepřetržitě každý měsíc
Žádný spam a 100% soukromí