Rozplývat se nad básní a zdrojovým kódem

Výstupy výzkumu Versologického týmu působícího při Ústavu pro českou literaturu Akademie věd většinou nemají podobu klasické literárně vědecké práce. Kromě textů publikují versologové hlavně aplikace, vizualizace nebo grafy, týkající se české poezie a jejího verše. Hlavním projektem Versologického týmu je Korpus českého verše, který má podobu interaktivní databáze. Jedním z členů týmu je Petr Plecháč, který s H7O mluvil o Korpusu, poezii nebo kvantitativním přístupu k literatuře.

Před rokem jste s Versologickým týmem vydali — či spustili — Korpus českého verše. Je o aplikaci zájem? Od spuštění registrujeme na našem webu desítky tisíc návštěv a tisíce dotazů do našich on-line nástrojů. U stránek zaměřených na versologii, která (co si budeme nalhávat) nestojí zrovna ve středu odborného zájmu většiny badatelů ani studentů, to, myslím, není špatný výsledek. Ohlasy — na sociálních sítích i v médiích — jsou veskrze velmi pozitivní. Dočetl jsem se, že Korpus českého verše může kromě badatelů a čtenářů posloužit i básníkům. Jak? Víte o nějakém? Básníci se mohou na našem webu inspirovat například v aplikaci Gunstick, která umožňuje vyhledávat rýmy doložené v poezii devatenáctého století (databáze obsahuje přes milion rýmových párů). Na webu jsem skutečně narazil na jednu básničku, u níž autorka uváděla, že všechny rýmy, které použila, našla v naší databázi. To je ale výjimka — on se vám málokterý básník přizná, že čerpal inspiraci u nás. Jak se na přístup Versologického týmu, používání matematických a neliterárněvědných metod dívají kolegové? Kritizuje vás někdo? S odmítavou kritikou jsme se zatím setkali jen velice okrajově. V počátcích to byly spíš pochyby: „Vážně věříte, že počítač dokáže poznat jamb od trocheje? Že je schopný najít rýmy?“ To jsme slýchali od kolegů často a nelze se tomu divit. O to větší pak bylo jejich nadšení, když se to skutečně podařilo.

Přehled českých rýmů, autor: Versologický tým

Narážím trochu na debatu a spory, které se v zahraničí vedou o „close“ a „distant reading“, pozorném čtení jednotlivých textů a analytickém, statistickém pohledu na celý literární korpus. Jsou to opravdu neslučitelné pozice? Vůbec ne. Ba naopak, navzájem se podmiňují. Empirický výzkum by měl mít vždy jak složku kvalitativní, která formuluje hypotézy, tak kvantitativní, která je ověřuje. Statistika dává odpovědi na otázky, smysluplnost otázek ale nezaručuje. Testovat hypotézy vystřelené od boku a doufat v nějaký smysluplný výsledek je stejný nešvar jako generalizovat na základě pár dokladů nějakého jevu. Bez důkladné analýzy literárních textů a jejich souvislostí můžete snadno skončit u trivialit typu „průměrná slabičná délka hexametrů je statisticky významně vyšší než průměrná slabičná délka pentametrů“. Franco Moretti, propagátor „distančního čtení“, tvrdí, že matematické a abstraktní přístupy jiných disciplín literární věda potřebuje i kvůli své teoretické vyčerpanosti. Souhlasíte? Přiznám se, že nejsem moc velkým fanouškem takzvaných „digital humanities“. Za tenhle termín se totiž schovává ledacos. Vtipně to glosoval na nedávné konferenci WDH 2015 Steven Krauwer: „Digital humanities nepředstavují žádný nový, svébytný obor. Otázky a úkoly zůstávají stejné, pouze nástroje se změnily. To, že jezdím do práce na kole, ze mě nedělá odborníka na bicycle humanities.“ Samotná kvantifikace není přece v literární vědě žádnou novinkou a pro lingvistiku to platí dvojnásob. Vždy ale sloužila k ověřování hypotéz vyvstávajících z nějaké teorie. Představa, že teorie nějak sama vykrystalizuje ze série experimentů, je prostě omyl. Chcete-li pomocí kvantitativních metod zkoumat třebas žánry, vždy potřebujete nějaký teoretický rámec, na jehož základě například vytvoříte trénovací vzorek pro strojové učení. Příklad z našeho korpusu: básnickou produkci můžete rozdělit do obrovského počtu možných tříd, třeba na básně začínající samohláskou a básně začínající souhláskou. Abyste mohli říct, že je to pitomost a že mnohem více informace (nejen ve smyslu entropie, ale i sémantiky verše) nese rozlišení básní na trochejské, jambické, rýmované, nerýmované a podobně, abyste zjistili, že s těmito proměnnými korelují další a další, k tomu potřebujete hypotézy odvozené z „close reading“ nějakého vzorku, tedy už zmiňovaný kvalitativní výzkum. Může se z kvantitativních studií literatury stát v Česku běžný akademický obor? Když budu mluvit jenom za oblast, na niž se specializuju, tj. kvantitativní a korpusová versologie, tak to je, troufám si říct, plně etablovaný obor, na čemž má u nás zásluhu především dlouholetá a světově uznávaná práce Miroslava Červenky a Květy Sgallové. Nepředpokládám ale, že by obor, který vyžaduje spoustu mravenčí práce a formulace jasných a falzifikovatelných hypotéz, mohl kdy co do atraktivity konkurovat různým módním „studies“. Samozřejmě bych se tuze rád pletl. Na internetu lze nalézt hned několik aplikací generujících ať už jako vtip nebo i vážně poezii. Je možné, že v budoucnu budeme za literaturu považovat i zdrojový kód aplikací a programovací jazyky? Básní v programovacích jazycích je na internetu k nalezení spousta. Tuším, že se tomu říká code poetry. Jestli může být něco s tak bytostně praktickou funkcí jako zdrojový kód považováno za umění, na to by měl odpovědět spíš estetik. Ale přiznám se, že stejně jako nad básní se dokážu dlouze rozplývat i nad elegantním a přehledným zdrojovým kódem.

18/11/2015

portrét (bývalá rubrika), portrét

Zdeněk Staszek

Aktuální číslo

06/26

Rozplývat se nad básní a zdrojovým kódem

Pošleme vám každý měsíc to nejzajímavější na e-mail

H7O | Časopis Host 7 dní online