Česká literární bibliografie Czech Literary Bibliography

Prezentace Charlotte Panuškové o využití tematického modelování v literární vědě

Ve čtvrtek 8. 2. 2024 představí naše kolegyně Charlotte Panušková během semestrálního kolokvia Phänomenologie der Digital Humanities na Freie Universität Berlin svou diplomovou práci. V ní se zabývá metodami vzdáleného čtení literatury a možnostmi tematického modelování Top2Vec.

Algoritmus Top2Vec umožňuje automatizovanou identifikaci latentní sémantické struktury a témat předkládaných textů, čímž kompenzuje slabiny jiných modelů, které často vyžadují předběžnou znalost počtu témat, seznamy zakázaných slov, která se v textu objevují s vysokou frekvencí, aniž by nesla význam (např. předložky, spojky) nebo ruční lemmatizaci textů.

Charlotte Panušková tento přístup aplikuje na současné české próze, u níž zkoumá, jakým způsobem se pojednávaná témata v textech konstruovala a jak korelují se závěry literární vědy.

Korpusové zastoupení autorů a jejich děl.
Ukázka klastrování literárních témat.