Cómo acabar de una vez por todas con las listas de los mejores libros

, 19 abril 2023 21:20 7 min read 23

Este medio se sostiene gracias a su comunidad. APOYA EL PERIODISMO INDEPENDIENTE .

Un pasillo en la biblioteca nacional de Catar. Tom kitto/Unsplash

Cada poco nos encontramos con la lista de “cien mejores libros de…”. Somos presa de una inclinación por las clasificaciones, para ordenar y limitar el universo que tiende a infinito, como apuntaba Umberto Eco en “El vértigo de las listas”.

El canon literario es una idea controvertida, llena de sesgos y reflejo de las posiciones de poder de quienes dictaminan sobre el gusto y lo que es arte perdurable, en mayúsculas.

Establecer las obras de lectura obligatoria y lo mejor de cada época es coto de los prescriptores del sistema educativo, camarillas académicas y grupos de comunicación. Sumados a las conmemoraciones de centenarios, antologías y revivals, está ahora el impacto en la mediación de los buscadores, influencers y los sistemas de recomendación.

Entonces ¿a quién podríamos hoy pedir una lista de obras literarias? El canon propuesto por un solo autor se considera demasiado personal; los realizados por colectivos u organizaciones, demasiado artificiales; los producidos por votación, insustanciales, y los obtenidos desde ChatGPT, Google o Instagram incómodos.

Aunque parezca que tenemos toda la información de ediciones, tiradas, ventas, traducciones y citas, hay poca claridad en los datos procedentes de catálogos de bibliotecas, editoriales o ventas. En su estudio sobre la arquitectura del género bestseller, José Antonio Cordón señala lo artesanas que son la listas de los libros más vendidos. Quizá sean hasta un subgénero de la ficción.

Tampoco existe ese repertorio ideal de todos los libros de todos los tiempos y en todos los países e idiomas que nos detalle cuántas ediciones se han hecho de un libro, con cuánta tirada, cuánto se ha vendido o en cuántas bibliotecas está. Obtener estos datos sería una aventura desmesurada, porque la infraestructura bibliográfica global está desarticulada o desbordada, pese a décadas de esfuerzo bibliotecario.

En nuestra última investigación “Un canon literario universal basado en datos enciclopédicos multilingües”, de próxima publicación en la Revista Española de Documentación Científica del CSIC, discutimos un método de medición indirecto a partir de dos únicas fuentes: todas las ediciones en cualquier idioma de Wikipedia y la base de datos vinculada con los artículos enciclopédicos, Wikidata.

Enciclopedia frente a catálogo

Existe una enciclopedia libre para cada idioma con una comunidad voluntaria suficientemente activa como para afrontar el esfuerzo de escribir y revisar sus artículos. En Wikipedia se habla de todo, pero también sobre libros, como puede verse este año en la campaña #CadaLibroSuPúblico.

No es un mero catálogo de biblioteca ni de librería, sino que solo aquellos libros que alcanzan notoriedad suelen merecer la elaboración de muchos y extensos artículos. De Los viajes de Gulliver encontraremos artículos en más de 60 idiomas, con detalles densamente conectados y referencias a estudios críticos. Estos artículos sobre libros, en muchos idiomas distintos, podemos considerarlos un reflejo de la atención sostenida sobre una obra cultural.

La actividad autónoma y no planificada de estas comunidades de editores nos permite reproducir de forma indirecta los resultados que podríamos obtener si procesáramos los datos de todas las ediciones de libros, su tirada, sus ventas, el interés despertado, su lectura, sus traducciones, su reedición, sus ediciones críticas o los estudios críticos realizados sobre ellas.

Apoyados en la idea del punto de vista neutral, trabajo descentralizado y multilingüe, el ecosistema Wikimedia podría ser un candidato para obtener resultados no mediados directamente por ningún autor, academia, institución nacional o grupo de interés. Los estudios sobre calidad, diversidad y cobertura en Wikipedia son desde hace años contundentes: es al menos tan solvente como el resto de empresas enciclopédicas imperfectas emprendidas. Ya que no hay suficientes “datos oficiales” de edición-distribución procedentes del mercado editorial global, medir la actividad reseñadora y de recopilación manifestada en los artículos de la enciclopedia colaborativa nos puede conducir a un sitio similar.

Los datos para un ranking de autores literarios son fáciles, porque en la identidad del autor se concentra la relevancia de todas sus obras, pero al buscar obras concretas se presenta un reto diferente. Por ejemplo, ¿qué obras de Shakespeare, autor ubicuo, quedarían fuera para dejar sitio a una novela de Jane Austen, también muy presente?

Para acabar con las listas, todas las Wikipedias

Una vez seleccionado un conjunto imperfecto de más de 100 000 obras literarias de todas las Wikipedias, el primer resultado que revela el análisis es que son 163 las obras que se destacan significativamente de las demás. Es una cantidad muy cercana a la que selecciona, por ejemplo, el ensayo de Christiane Zschirnt Libros, todo lo que hay que leer.

Diagrama del trabajo en el que se muestran todas las obras literarias agrupadas en tres clústeres: en el clúster 1 se ve la producción literaria, en el clúster 2 las obras relevantes (1008 libros) y en el clúster 3 el canon universal (163 obras).
Author provided

Así que ya sabemos el volumen a reservar en la misión espacial encargada de salvar el legado literario universal, apenas 163 libros. Al tener que seleccionar, usando los artículos en Wikipedia-Wikidata como patrón de medida, en español solo se salvarían El Quijote y Cien años de soledad. ¿Cómo se reflejan todas las culturas, épocas e idiomas? Es un problema irresoluble, siempre tentativo.

El procesamiento realizado sobre los datos enciclopédicos de los libros nos permite obtener además el orden que impera en la lista final. Se contabilizan el número de Wikipedias en las que hay artículo sobre un libro, el número de palabras usadas y el número de descripciones realizadas en Wikidata para obtener una selección y un ranking funcional.

Ahora que hemos asignado una puntuación a cada obra literaria presente en Wikipedia, podemos obtener un listado del estilo de “los mil libros más importantes del siglo XX”.

Una revisión de los títulos obtenidos plantea de inmediato dudas sobre cómo manejar cada parte –en el caso de obras compuestas como La Biblia, por ejemplo, y sus diferentes partes–, y hasta dónde llevar el concepto de literatura –como ocurre con La riqueza de las naciones, de Adam Smith–. También surgen anomalías, como la aparición de Mein Kampf de Adolf Hitler en la selección, y un tumulto de preguntas sobre los best-seller literarios, la presencia de autoras, los idiomas no occidentales y las lenguas muertas.

Cada autor que elabora una selección de obras tiene sus caprichos y limitaciones, y nuestro estudio sobre Wikipedia indica que miles de autores no coordinados también terminan resultando caprichosos. Podemos pensar que estamos observando algo más parecido a cierta clase de atención –erudita, enciclopédica, curiosa– que calidad literaria.

Los datos –los nuestros y los originales de Wikipedia-Wikidata– están disponibles para quien busque perfilar mejor otro canon universal hecho a máquina y transparente en su metodología.

Los veinte primeros libros del canon según las Wikipedias

Génesis, relato bíblico
Ilíada, de Homero
Hamlet, de William Shakespeare
Romeo y Julieta, de William Shakespeare
Don Quijote de la Mancha, de Miguel de Cervantes
Shahnameh, epopeya persa
Ulises, de James Joyce
Harry Potter y la piedra filosofal, de J.K. Rowling
Alicia en el país de las maravillas, de Lewis Carroll
Lolita, de Vladimir Nabokov
Macbeth, de William Shakespare
Orgullo y prejuicio, de Jane Austen
Antiguo Testamento, relato bíblico
El hobbit, de J. R. R. Tolkien
Las mil y una noches, serie de cuentos orientales
Drácula, de Bram Stoker
Éxodo, relato bíblico
Guerra y paz, de León Tolstói
1984, de George Orwell
Crimen y castigo, de Fiódor Dostoyevski

La investigación principal que se presenta en este texto tiene prevista su publicación en la Revista Española de Documentación Científica del CSIC durante este año 2023.

Tomas Saorín es miembro de Wikimedia España, asociación sin ánimo de lucro para la promoción del conocimiento libre.

Juan Antonio Pastor Sánchez no recibe salario, ni ejerce labores de consultoría, ni posee acciones, ni recibe financiación de ninguna compañía u organización que pueda obtener beneficio de este artículo, y ha declarado carecer de vínculos relevantes más allá del cargo académico citado.

Este periodismo no lo financian bancos ni partidos

Lo sostienen personas como tú. En un contexto de ruido, propaganda y desinformación, hacer periodismo crítico, independiente y sin miedo tiene un coste.

Si este artículo te ha servido, te ha informado o te ha hecho pensar, puedes ayudarnos a seguir publicando.

Apoya este medio independiente

Cada aportación cuenta. Sin intermediarios. Sin líneas rojas impuestas. Solo periodismo sostenido por su comunidad.

DESTACADA, POLÍTICA ESTATAL

Aporofobia. Un concejal del PP asegura que las fuentes públicas para beber “atraen a indigentes”

NOTICIAS

Mire cómo somos los mexicanos: los inicios de Cantinflas

Ayuso convierte la maternidad en trinchera ideológica con su “ley del concebido no nacido”

Isabel Díaz Ayuso ha anunciado que el próximo 2 de julio llevará a la Asamblea de Madrid un pleno extraordinario para debatir y aprobar la llamada “ley del concebido no nacido”. No es una anécdota parlamentaria. No es una medida técnica. Es una pieza más en la ofensiva reaccionaria que intenta reescribir los derechos sexuales y reproductivos con lenguaje administrativo, una carpeta institucional y una sonrisa de superioridad moral.

La propuesta reconoce al “concebido no nacido” como “miembro más de la unidad familiar”. Dicho así parece una fórmula burocrática. Pero no lo es. Es política pura. Y de la más peligrosa: la que pretende colarse por la puerta de las ayudas sociales para instalar una visión ultraconservadora de la maternidad, del cuerpo de las mujeres y de la familia. No están ampliando derechos: están moviendo el marco para que el embarazo pese jurídicamente antes que la vida material de las mujeres.

Redaccion, 19 junio 2026 07:39 0

El pacto entre EE.UU. e Irán redibuja Oriente Medio y deja a Israel mirando el desastre

El acuerdo entre Estados Unidos e Irán, firmado el 18 de junio por Donald Trump y Masoud Pezeshkian, ya tiene su etiqueta grandilocuente: el “gran pacto”, el “acuerdo del siglo”, la jugada histórica que supuestamente cerraría una etapa de guerra y abriría otra de negociación. La liturgia también fue cuidadosamente escogida. Trump lo formalizó en Versalles, al margen de la cumbre del G7, como si el decorado imperial pudiera maquillar lo evidente: las potencias no reconstruyen el orden internacional, lo reparten.

Es el primer pacto firmado por un presidente estadounidense y un presidente iraní desde la Revolución Islámica de 1979. No es un detalle menor. Tiene 14 puntos, prolonga el alto el fuego durante 60 días, incluye a Líbano y abre la puerta a negociar un arreglo permanente, incluido el programa nuclear iraní. Dicho así parece diplomacia. Pero la diplomacia, cuando llega después de miles de muertos, suele ser el nombre elegante del fracaso moral.

Redaccion, 19 junio 2026 07:37 0

Israel rompe con Kaja Kallas porque ya no soporta que Europa pronuncie la palabra apartheid

El ministro de Exteriores israelí, Gideon Saar, anunció el 18 de junio que rompe “todo contacto” con la jefa de la diplomacia europea, Kaja Kallas. La razón, según él, es que Kallas habría comparado a Israel con la Sudáfrica del apartheid durante una visita a México el pasado mayo. No hablamos de una ruptura por una masacre, ni por la expansión colonial en Cisjordania, ni por el asedio a Gaza, ni por la normalización de un régimen de privilegio étnico, militar y territorial. Hablamos de una ruptura por una palabra.

Ahí está el asunto. Israel no rompe con quien bombardea, ocupa, desplaza, bloquea o coloniza. Rompe con quien señala.

Redaccion, 19 junio 2026 07:36 0

Vídeo | Estrenamos este domingo la segunda parte del reportaje “Palestina y la historia que quieren borrar”

Spanish Revolution estrena este domingo a las 15:00 la segunda parte de “Palestina y la historia que quieren borrar”, el reportaje dirigido y presentado por Patricia Salvador dentro de #ReportajesSR, el proyecto audiovisual dirigido por Patricia Salvador y Lea Guggelman.

Bajo el título “La Nakba eterna”, esta nueva entrega continúa el recorrido iniciado en el primer capítulo, donde se abordaba la Nakba para desmontar la mentira de que la historia de Palestina comienza el 7 de octubre.

Redaccion, 19 junio 2026 07:25 0

Vídeo | El turismo que saquea las ciudades mientras sonríe para la foto

El turismo urbano ya no puede seguir vendiéndose como una postal amable, una maleta con ruedas y una pareja haciéndose fotos frente a una fachada histórica. En demasiadas ciudades se ha convertido en otra cosa. En una forma educada de saqueo. Entra sonriendo, paga tres noches, deja propina si toca, sube una historia a Instagram y se marcha. Lo que queda detrás no sale en la foto: alquileres imposibles, vecinas expulsadas, comercios de barrio sustituidos por locales sin alma y calles que ya no pertenecen a quienes las habitan.

No es turismo. Es extracción.

Redaccion, 19 junio 2026 07:24 0

Blog

Cómo acabar de una vez por todas con las listas de los mejores libros

Enciclopedia frente a catálogo

Para acabar con las listas, todas las Wikipedias

Los veinte primeros libros del canon según las Wikipedias

Este periodismo no lo financian bancos ni partidos

SÍGUENOS

Ayuso convierte la maternidad en trinchera ideológica con su “ley del concebido no nacido”

El pacto entre EE.UU. e Irán redibuja Oriente Medio y deja a Israel mirando el desastre

Israel rompe con Kaja Kallas porque ya no soporta que Europa pronuncie la palabra apartheid

Vídeo | Estrenamos este domingo la segunda parte del reportaje “Palestina y la historia que quieren borrar”

Vídeo | El turismo que saquea las ciudades mientras sonríe para la foto

Transparencia económica en Spanish Revolution

Blog

Cómo acabar de una vez por todas con las listas de los mejores libros

Enciclopedia frente a catálogo

Para acabar con las listas, todas las Wikipedias

Los veinte primeros libros del canon según las Wikipedias

Este periodismo no lo financian bancos ni partidos

Related posts

Una reforma de las pensiones lenta pero segura

La celulosa de la ría de Pontevedra: cómo preservar el trabajo y el medioambiente

Los retos jurídicos de la inteligencia artificial a través de seis casos reales

El truco para fomentar la actividad física entre los jóvenes mientras se lucha contra el cambio climático

China acaba de revelar datos cruciales sobre el origen de la COVID-19. Si lo hubiera hecho antes podría habernos ahorrado tres años de discusiones

La cría de insectos comestibles como alternativa sostenible a la producción de carne

SÍGUENOS

Ayuso convierte la maternidad en trinchera ideológica con su “ley del concebido no nacido”

El pacto entre EE.UU. e Irán redibuja Oriente Medio y deja a Israel mirando el desastre

Israel rompe con Kaja Kallas porque ya no soporta que Europa pronuncie la palabra apartheid

Vídeo | Estrenamos este domingo la segunda parte del reportaje “Palestina y la historia que quieren borrar”

Vídeo | El turismo que saquea las ciudades mientras sonríe para la foto