Què pot revelar la IA sobre la literatura catalana? Tres experiments literaris ens fan llegir Mercè Rodoreda, Quim Monzó, Irene Solà o Josep Pla d’una manera nova

Quan es va inventar la fotografia, el públic va haver d’aprendre a mirar la pintura d’una manera nova. Ja no n’hi havia prou amb l’admiració tècnica, ara calia trobar alguna cosa màgica capaç d’anar més enllà de la representació de la realitat. Des que podem dir que un text sembla escrit amb ChatGPT, llegim i escrivim com si un robot ens mirés per sobre l’espatlla, una hiperconsciència que ens diu que és més important que mai no cedir a verbs procedimentals ni adjectius estrafets. Com llegim els nostres autors preferits ara que hi ha models capaços d’imitar-los? Què pot revelar la intel·ligència artificial sobre el geni de Josep Pla o Mercè Rodoreda? Per celebrar Sant Jordi, ens hem proposat investigar-ho.

A Rodoreda li agrada mirar

Un dia d’aquest hivern plujós vaig anar al taller del col·lectiu Estampa (que són Daniel Pitarch, Pau Artigas, Roc Albalat, Marcel Pié i Marc Padró) al barri de Gràcia. En un racó, una desena de persones es mirava una pantalla que un d’ells manipulava. Sobre una taula, el premi Ciutat de Barcelona que havien recollit el dia anterior. El va merèixer el projecte Cartografia de la IA Generativa, un mapa que tradueix la intel·ligència artificial, tan etèria, en el que realment és: un conjunt de recursos, engranatges i activitats humanes. El jurat parlava de “transparència i accessibilitat”, perquè un dels pilars d’aquest grup de programadors, realitzadors i investigadors és baixar la intel·ligència artificial del pedestal totpoderós que generalment ocupa i donar-li materialitat. Ens hem acostumat tant als tecnòcrates que dominen internet que t’esperaries d’ells l’altivesa de qui ha conquerit el coneixement objectiu, però el que em trobo en les seves propostes és una curiositat lúdica per tot allò que se n’escapa.

Jo desconec tot el que té a veure amb enginyeria i programació, però havia llegit l’assaig Nabokov’s favorite word is Mauve (Simon & Schuster), de Ben Blatt. Publicat l’any 2017, quan encara parlàvem més de big data que d’intel·ligència artificial, aquest assaig posava estratègies tan objectives com l’anàlisi estadística al servei d’un propòsit tan subjectiu i romàntic com esbrinar què ens sedueix de l’escriptura d’algú. Resulta que els escriptors que històricament han estat considerats bons fan servir menys adverbis que la resta; que durant les últimes dècades els best-sellers han anat reduint el ventall de paraules; o, com diu el títol, que la paraula preferida de Nabokov és malva. Aquest no és l’únic experiment que ha buscat connectar estadística i literatura: no és difícil trobar a internet eines de codi obert que permeten extreure la puntuació de qualsevol text i, fins i tot, convertir-lo en un pòster decoratiu. La gràcia de tot plegat és que l’algoritme deixa de ser una amenaça que substituirà els escriptors i es converteix en una eina per escoltar-los millor.

Inspirats en Blatt, vam voler llegir d’una manera nova els nostres autors. Vam decidir destriar les paraules preferides de quatre escriptors, dos de vius i dos de morts, molt coneguts i llegits, perquè el que volíem era provar si el resultat provoca un efecte de reconeixement d’idees preconcebudes o bé d’estranyesa. A Estampa van aïllar totes les paraules de l’obra de Josep Pla, Mercè Rodoreda, Sergi Pàmies i Irene Solà (ells ho descriuren com “desfer un collar de perles”), van eliminar les paraules més comunes (articles, preposicions o verbs molt procedimentals) i també les que es repetien en proporcions similars entre tots quatre. És a dir, les paraules extretes no són exactament les més usades, sinó les que per estadística es consideren més idiosincràtiques un cop els comparem entre si.

El que sorprèn més del resultat és que sorprengui tan poc. En la llista de cadascú hi ha alguna cosa capturada que fa pensar que, quan llegim, el nostre cervell també funciona com una màquina estadística que treu conclusions a partir de repeticions. Ens pensem que captem el misteri, però també estem comptant paraules. És gairebé impúdic comprovar que, si avui pensem que Pla és el millor relligant realitat i literatura, és també una mica perquè va insistir a incloure la realitat en la seva literatura. Sembla que no hi ha res més creatiu que ser sistemàtic.

El detector de singularitats estadístiques ens diu que la paraula que més bé captura la poètica de Rodoreda ocupa un 0,355% de la seva obra i és mirar. Fa servir encara més veure, un 0,541%, i ulls, un 0,443%, però l’algoritme ens fa notar que són massa genèriques per distingir-la dels altres tres autors. Fa tot just un any, Neus Penalba publicava l’assaig Fam als ulls, ciment a la boca (3i4), on, per parlar d’una “narrativa ocularcèntrica” recull les respostes de Rodoreda al “Qüestionari Proust” de 1979: “—La meva ocupació preferida? —Mirar […]. —Quina seria la meva major desgràcia? —No poder mirar”. Però el que dona el geni literari a Rodoreda no és la insistència en el tema, sinó tot allò que és capaç d’invocar fora del text cada vegada que mira. Hi ha una filosofia en els ulls afamats o en els ulls que volen fugir de les conques per un espant, perquè en Rodoreda les paraules no descriuren l’experiència, la fan angoixosament física: les mans s’aturen “damunt” (0,454%) del cor perquè no fugi (‘Semblava de seda’).

Si el verb que més fa servir Rodoreda és dir, el preferit de Pla és ser en tots els seus temps. Tenint en compte l’amplitud de la seva obra periodística, és evident per què les seves paraules preferides apareixen en un percentatge molt més baix. La seva aspiració periodística vol fer servir el llenguatge per traçar un mapa de la realitat (0,104%) i per això les seves paraules preferides sovint són els noms amb què anomenem les coses: país (0,376%), història (0,115%), llibre (0,106%) o esperit (0,094%).

Sergi Pàmies ha dit alguna vegada que, en una literatura plena d’homes desorientats, ell ha optat per no incloure-hi dones, a causa d’ una barreja de consciència del ridícul d’escriptures masculines llefiscoses i perquè no s’atreveix a interpretar-les. Ara bé, la dona hi apareix, en la seva literatura (0,321%), però sovint com a objecte irònic: “la dona de la meva vida”. És a l’únic a qui ensenyo el resultat d’aquest joc: pregunta no el sorprèn gens, i em confessa que quan escriu ell fa el mateix experiment de formes més barroeres per eliminar repeticions. La que més, però (0,810%).

Sobretot a Et vaig donar ulls i vas mirar les tenebres (Anagrama), la genealogia femenina és molt important en Irene Solà: les filles es queden a casa (0,497%) i hereten de les mares (0,455%) el folklore i les històries que ens fan qui som, mentre que els homes (0,293%) participen de la Història. I sempre s’ha dit que Irene Solà s’inspira en Rodoreda. Tant que, en un experiment previ d’Estampa, el llibre M’has parlat i t’he dit que et vaig dir que no et digui (Como), Solà s’adonava que parlava una mica amb ella quan conversava amb una xarxa neuronal entrenada amb textos literaris catalans. Com en Rodoreda, en Solà hi ha moltes paraules sobre el cos i l’espai, però la repetició de paraules, segons l’algoritme, no té per què indicar una semblança en altres dimensions.

Una gran biblioteca

Un problema habitual en una biblioteca és com d’arbitrari pot ser l’ordre. Un llibre de Perejaume té més sentit a la secció de natura, de poesia o d’assaig? Són molts els factors que fan que un llibre s’assembli més o menys a un altre, des dels gèneres literaris establerts fins als camps semàntics, els temes o l’estructura de les frases. Què passaria si una biblioteca pogués transcendir les tres dimensions? És possible crear relacions a molts nivells alhora, fins i tot més de les que percebem els humans? És el que s’anomena espai latent, un “mapa matemàtic on el model d’IA situa patrons i relacions que ha trobat en les paraules amb què va ser entrenat”, diuen a Estampa. Vam decidir provar-lo amb els deu primers títols de l’enquesta dels millors llibres dels últims cinquanta anys que vam publicar aquí tot just fa un any.

Les relacions que en resulten són abstractes per a l’ull humà, però poden fer una cosa tan poètica com posar un llibre al costat de l’altre i insinuar-te que allà hi ha un sentit. En alguna dimensió oculta, resulta que Jo confesso és una obra transversal, que Solà i Rodoreda no s’assemblen gaire però Solà, Marçal i Rojals sí; que Moncada i Roig es toquen, i Pagès Jordà i Monzó fan el mateix arc en paral·lel.

Pots clicar aquí per anar al mapa interactiu.

El dormitori matrimonial

Tots ho hem provat a casa, i els xatbots tendeixen a funcionar millor quan han d’imitar textos obscurs i plens de floritures i no proses més sòbries. Hi ha alguna cosa en la depuració estilística que és paradoxalment difícil d’imitar, perquè cada paraula està obligada a contenir més significat. Per això vam decidir posar la IA a prova amb un referent de la sobrietat i la depuració com és Quim Monzó. Amb la complicitat de l’editora Sandra Ollo, li vam demanar permís per entrenar un model amb la seva obra completa i ens va dir que sí. El model que Estampa van fer servir havia estat entrenat prèviament en català amb Aina, un projecte de la Generalitat de Catalunya enfocat a potenciar el català en l’àmbit digital que ningú sabia que acabaria en un experiment com aquest. És a dir, compta amb un corpus de text més reduït i concret que els generadors a què estem acostumats.

A partir del processament dels textos, el model va aprendre a reconèixer patrons específics de Monzó i va generar diverses opcions de text que, en conjunt, són un resum grotesc de la seva obra: hi ha sexualitat, mediocritat de la vida moderna a la ciutat, desdoblaments absurds i moltes enumeracions —un dels contes feia així: “L’home va asseure’s a l’escriptori. Va agafar la llibreteta i hi va anotar: ‘Avui, per primer cop en molt de temps, faré una cosa que m’omple de goig: escriure un conte’. Va començar a teclejar. El segon paràgraf el va deixar sense acabar. El tercer ja estava enllestit. El quart també”; i l’enumeració continuava fins a arribar a nombres incòmodament inexistents. El que vam triar és estrany però idiosincràtic: “El resum que fa de l’escriptura de Monzó no va gens desencaminat”, afirma Borja Bagunyà quan li demano que l’analitzi, “un món enganyosament quotidià, una sintaxi senzilla, una marca metaliterària (com els noms compostos de la paròdia del melodrama de La magnitud de la tragèdia o el joc de dins i fora amb el quadre i el somni), l’esclat d’una sexualitat més o menys infeliç; em consola constatar, però, que no encerta encara el seu humor ni el geni de la llengua”.

Hi ha un estranyament, en aquest conte, com si escoltéssim un monòleg còmic en una llengua estrangera: podem deduir que ens intenten fer riure però no per què. Monzó no escriuria mai sobre un “dormitori matrimonial” o “un llibre per llegir” sense una intenció irònica que aquí és impossible de desxifrar. En les paraules d’aquest Monzó artificial hi ha l’empremta del món que el Monzó real va crear; mentre que en les paraules del Monzó real hi ha l’empremta de qui vol crear un món nou. Els posem l’un davant de l’altre i en la distància que els separa hi ha el plaer de buscar nous significats ocults, paraules preferides i comparacions originals. En definitiva, el desig de continuar llegint.

Aquí pots llegir l’article del col·lectiu Estampa.

Seguir leyendo

En col·laboració amb el col·lectiu de programadors Estampa, tres jocs literaris analitzen les paraules preferides, les semblances i l’estil d’alguns dels escriptors més rellevants i proposen lectures de la seva obra

A Rodoreda li agrada mirar

Esquemes amb les paraules preferides de Mercè Rodoreda (a sobre a l'esquerra), Josep Pla (a sobre a la dreta), Irene Solà (a sota a l'esquerra) i Sergi Pàmies (a sota a la dreta) — Esquemes amb les paraules preferides de Mercè Rodoreda (a sobre a l’esquerra), Josep Pla (a sobre a la dreta), Irene Solà (a sota a l’esquerra) i Sergi Pàmies (a sota a la dreta)ESTAMPA

Una gran biblioteca

Pots clicar aquí per anar al mapa interactiu.

El dormitori matrimonial

Un conte de Quim Monzó

El dia abans, l’Anna-Francesca s’ha passat el matí arreglant els calaixos de la tauleta de nit. Ha tret les fundes dels coixins i n’hi ha col·locat de noves. Després ha fet el mateix amb els edredons. I amb els llençols. Quan ha acabat, s’ha aixecat i se n’ha anat a una de les habitacions que hi ha a tocar del dormitori matrimonial. Hi ha penjat d’una de les parets un quadro on es veu una dona asseguda en una butaca vermella, mirant cap a un punt indeterminat de l’habitació. L’Anna-Francesca li ha preguntat què volia. El Ramon-Maria li ha dit que res. La noia ha mirat el quadro durant uns segons i, tot seguit, l’ha arrencat de la paret i l’ha posat sobre la tauleta. Amb els dits, l’Anna-Francesca ha marcat amb llapis tres zones del quadro: la dona asseguda, la butaca vermella i el fons de l’habitació. Després, s’hi ha acostat i l’ha palpat. No hi havia dibuixat ni la cadira ni la butaca. En canvi, sí que hi havia dibuixat el fons de l’habitació: una paret grisa, sense mobles, llevat d’un sofà gran, blanc, contra la paret, i una taula baixa, també blanca, al costat de la finestra. L’home no sap ben bé per què ho ha fet, però quan l’ha tornat a col·locar al lloc on era li ha semblat veure-s’hi ell mateix, assegut en aquella mateixa butaca vermella, mirant cap a l’habitació des d’on ella ara observava el quadro. L’Anna-Francesca ha caminat fins a la sala d’estar, on el Ramon-Maria li ha deixat un llibre per llegir. L’Anna-Francesca no ha trigat gaire a acabar-lo. Després, quan el Ramon-Maria ja dormia, l’ha deixat sobre el coixí i s’hi ha estirat. El Ramon-Maria havia somiat que ella era al llit amb ell, despullada i masturbant-s’hi.

EL PAÍS