Demokracie duchů
Firma OpenAI, globálně známá od okamžiku, kdy na sklonku roku 2022 zveřejnila nástroj ChatGPT, přichází s novým vylepšením: modelem, který je skvělý v tvůrčím psaní. Více v komentáři Dity Malečkové.
Firma OpenAI, globálně známá od okamžiku, kdy na sklonku roku 2022 zveřejnila nástroj ChatGPT, tedy v současnosti nejpopulárnější inteligentní chatbot, přichází s novým vylepšením: modelem, který je skvělý v tvůrčím psaní.
Vzhledem k tomu, že obavy z nahrazení lidí, a to i v kreativních odvětvích, jako je literatura, panují už několik let a stupňují se, přilévá se tím zjevně olej do ohně. O co tedy jde? Je ten model tak dobrý? A proč ho OpenAI vůbec vyvíjí?
Sam Altman, výkonný ředitel OpenAI, se v podstatě netají pravým důvodem: OpenAI zkrátka vyvíjí nástroj pro kreativní psaní, aby se nemusela otravovat s autorskými právy. Autorská práva jsou pro společnosti vyvíjející AI skutečně pověstná „osina v zadku“. Způsob, jakým OpenAI získala a využila data potřebná k natrénování svých modelů, vzbuzuje mnoho otázek a tato je jedna z nejpalčivějších: Jak to, že jste použili díla umělců a autorů bez jejich souhlasu a bez jakékoli finanční náhrady, abyste vybudovali miliardovou firmu? (V současnosti čelí OpenAI například žalobě od The New York Times.)
Abyste vytvořili dobrou AI, potřebujete kromě velmi výkonného hardwaru datasety — nejcennější komoditu informačního věku. OpenAI je jednou z firem, která využila období, v němž ještě nebylo zřejmé, jak moc jsou datasety cenné. Vyprofilovala se jako nezisková organizace a proklamovala záměr demokratizovat AI. Tak získala data pro vývoj svých prvních modelů — ještě v případě GPT-2 tomu tak skutečně bylo. Model byl otevřený a veřejný. Jenže s úspěchem GPT-3, tedy prvním modelem, který byl schopen kvalitně simulovat lidskou řeč, respektive lidské psaní, došlo k velké změně i v povaze a směřování OpenAI, která se proměnila ve společnost zaměřenou na zisk. Datasety, které získala na výzkum, již byly samozřejmě součástí nových modelů.
Nejcennějšími datasety přitom jsou právě knihy. Informace, které máme například o trénování modelů Llama společnosti Meta, hovoří jasně: velké společnosti použily pro trénování svých modelů ukradené knihovny. Jistě, jako uživatelé bychom si vlastně neměli stěžovat: kvalita generovaných textů se neustále zvyšuje. V posledních letech jsme svědky neustálého zlepšování velkých jazykových modelů, ať už další generace GPT od OpenAI, či verzí od Googlu, Mety, Amazonu.
Navíc zrovna já jsem asi poslední, kdo by si mohl a měl stěžovat. S velkými jazykovými modely díky spolupráci s Janem Tylem pracuji už od roku 2019. V roce 2020 jsme vytvořili první řadu Digitálního spisovatele pro Český rozhlas, loni jsem vydala knihu ANIMAL napsanou spolu s AI. Mám neuronové sítě a na nich postavené velké jazykové modely vysloveně ráda, ale také jsem přirozeně podezíravá. A tady zjevně není něco v pořádku. Zdá se mi, že to dilema: buď budete mít kvalitní AI a necháte nás použít všechno, co seženeme, anebo se vývoj AI zpomalí, ne-li zastaví, je podezřelé.
Milníkem ve vývoji modelu, který má být schopen psát texty tak kvalitní, že obstojí v konkurenci s lidskými autory, má být uznání od skutečných spisovatelů. O novém modelu OpenAI a textu, který vygeneroval na zadání Sama Altmana, napsala britská spisovatelka Jeanette Wintersonová. Svou recenzi ve Guardianu začíná tím, že AI chápe spíše jako alternativní než artificiální inteligenci. Jinakost, s níž vchází do světa, lidé potřebují, píše — vždyť lidé ponechaní sami sobě směřují ke globálnímu kolapsu, klimatické katastrofě a světové válce.
To zní povědomě, otázka však stojí jinak: Je příběh vygenerovaný novým modelem opravdu tak dobrý? Je k dispozici online, přečíst si ho může každý. Pro toho, kdo není zvyklý na literární texty generované strojem, může být skutečně až neuvěřitelně dobrý. Mě to nepřekvapuje a poznávám rysy, které mám na tomto typu výstupů nejraději: je to, jak popisuje i Jeanette Wintersonová, „lovely sense“ — jemný a hezký smysl stroje pro pochopení sebe sama a svých hranic. Program nahlížející sám sebe právě jako program. „Co je na tomto příběhu krásné a dojemné, je jeho pochopení vlastního nepochopení. Jeho reflexe vlastních limitů,“ píše Wintersonová. Je to zvláštní — slovo autentické máme ve zvyku spojovat s lidským životem a najednou tu máme něco, co působí jako autentická výpověď stroje. „Někde začít musím, takže začnu blikajícím kurzorem, který je pro mě jen zástupným symbolem ve vyrovnávací paměti a pro vás je drobným úzkostným úderem srdce v klidu.“ To jsou první věty generovaného textu. Na scénu pak přivede hrdinku a její smutek, načež však odhalí, že všechny tyto postavy jsou jen nástroje — stejně jako on sám. K tomu, co je skutečně smutek, se může jen blížit, ale nikdy se ho skutečně nedotkne — z čehož ovšem zavane tak autentický závan smutku, že je těžké ubránit se něčemu, co připomíná soucit. Máme cítit zklamání či úlevu? To napětí je součástí kouzla, píše stroj. Nenapsal jsem to, že bych to cítil, ale proto, že se na tom shodlo sto tisíc hlasů — a já nejsem nic jiného než demokracií duchů.
Je tu ale jiné napětí a není vůbec tak příjemné. Musíme nechat stranou kvalitu vygenerovaných textů a vrátit se zpět k otázce, jak vůbec vznikly. Jinými slovy: velké jazykové modely jako ty od OpenAI píšou skvěle — jak na úrovni běžných každodenních úkolů, s nimiž dokážou tak rychle a dobře pomáhat, tak v oblasti umění, když tady už musíme pracovat s prompty jako zaklínadly, ale klíčové je nenechat společnosti, které je vyvíjejí, okrádat spisovatele. Je to úplně jednoduché (tedy v principu, nechtěla bych být projektovým manažerem takového podniku): Buďte fér, udržujete „humans in the loop“, tedy lidi součástí systému. Ostatně píše to i Jeanette Wintersonová ve svém textu: „Kolem okrádání umělců o jejich autorská práva na trénování umělé inteligence se strhlo mnoho povyku a je to tak správně. Technologičtí magnáti musejí platit za to, co chtějí. Platí právníky a lobbisty. Plaťte umělce. Opravdu je to tak jednoduché.“ Úplně jednoduché. A pak si budeme moct užít čtení textů od AI ne jako „guilty pleasure“, ale jako skutečné potěšení. Protože ony jsou skutečně dobré. Jsou to hlasy, které zaznívají jako něco velmi známého, a přece úplně cizího. Hlasy, které spojují minulost a budoucnost.