Posibilidades de la minería de datos digital para el análisis del personaje literario en la novela española: El caso de Galdós y los "Episodios Nacionales"
El análisis del personaje literario ha sido tradicionalmente realizado mediante lecturas cercanas (close readings) de los textos narrativos en conexión con aspectos tales como la trayectoria de vida del personaje, la trayectoria alternativa de otros personajes, el medio ambiente representado en el texto o incluso la vida del autor. Como podemos imaginar, las alternativas desarrolladas son múltiples y, en última instancia, difíciles de generalizar para todo tipo de relato. A raíz de la disponibilidad de obras literarias en forma digital, no obstante, se han puesto a punto metodologías de análisis que combinan la tradición hermenéutica con el análisis computacional. Aunque se han desarrollado herramientas de anotación en lengua inglesa, generando con ello numerosos análisis de obras teatrales, novelas e incluso cómics, lo cierto es que nos encontramos con carencias para los que investigamos en español a la hora de replicar dichos análisis. Se trata de limitaciones que estimo posible paliar mediante un trabajo de adaptación de las metodologías a nuestro idioma. Con el objetivo de contribuir a los estudios culturales y a las humanidades digitales, esta tesis doctoral presenta una metodología de minería de datos para un análisis de los personajes en la narrativa en español. En concreto, desarrollo un método de anotación del personaje y una parametrización para la extracción, el análisis y la visualización de los datos del sistema del personaje mediante análisis de grafos y redes sociales. Para el particular, me he centrado en el corpus formado por los Episodios nacionales de Benito Pérez Galdós (1843-1920), un conjunto de 46 novelas divididas en cinco series, publicadas entre 1872 y 1912. Los resultados del análisis de la tercera serie sugieren que existe una correlación entre las particularidades del sistema de los personajes y la tipología de cada episodio, lo cual encaja con interpretaciones previas de la serie. Así, la principal diferencia entre las redes de los diez episodios es una protagonicidad inversa de los actantes históricos y los ficticios en las novelas individuales respecto de las ocupadas en un bildungsroman seriado. Dicho protagonismo se da tanto en el estudio del espacio del personaje, esto es, la frecuencia de mención del nombre del personaje en toda la novela, como en la posición de los personajes en las comunidades del sistema del personaje, al conformar grupos diferenciados.