Este medio se sostiene gracias a su comunidad. APOYA EL PERIODISMO INDEPENDIENTE .

Cada día se habla con mayor naturalidad de inteligencia artificial (IA). Nos vamos acostumbrando a que esta etiqueta –con un significado para muchos aún rodeado de un halo enigmático– penetre con mayor frecuencia en nuestra rutina.
Sin ser apenas conscientes, sonreímos para desbloquear el teléfono móvil sin saber que tras ese segundo delante de la cámara, miles de píxeles convertidos en datos alimentan a gran velocidad algoritmos de deep learning. Estos son hoy día capaces de automatizar el reconocimiento facial en unos porcentajes superiores al 98 % de exactitud.
La eclosión ha sido estelar. Podemos considerar como punto esencial la victoria de DeepMind frente al primer jugador mundial de Go en 2016. En apenas 5 años, la afortunada combinación del volumen exponencial de datos generados, la creación de sistemas de procesamiento suficientemente potentes (unidades de procesamiento gráfico o GPU) y la madurez y liberación de los algoritmos de redes neuronales (como Tensorflow), han hecho realidad programable toda la teoría matemática que sienta sus bases en los años 50 del siglo XX, con las primeras teorías de Marvin Minsky o John McCarthy sobre el aprendizaje automático.
¿Robots que hablan? No es tan sencillo
Debajo de esa magia, que hace que la informática trate de comportarse como el cerebro humano, hay una combinación de distintas tecnologías y tipos de datos que no funciona con el mismo éxito ni de la misma forma para resolver todos los problemas.
La paradoja está servida: nos atemoriza un mundo en el que los robots amenazan con suplantar nuestras funciones laborales, pero a día de hoy, asistentes como Siri, Alexa y Google Home son todavía incapaces de mantener una conversación de más de unos minutos, más allá de solicitar una serie de datos, dar órdenes sencillas o establecer rutinas concretas.
Hacer hablar –y escribir– a las máquinas es una de las labores más complejas a las que se ha enfrentado jamás la computación. Ya en 1951 Alan Turing planteó el reto del juego de la imitación, en el que ser humano y máquina podrían confundirse a través del lenguaje, realidad aún muy lejana hoy.
El lenguaje humano es altamente complejo y variado. Es un sistema vivo sobre el cual los algoritmos que tejen estas neuronas digitales que constituyen la inteligencia artificial van aprendiendo con los datos de los que se nutren. Así, estas células informáticas van adquiriendo vocabulario y mejorando sus estructuras lingüísticas gracias a su exposición constante a los datos conversacionales.
Mejor en inglés que en español
La realidad nos demuestra que, a día de hoy, la competencia de esta tecnología es muy superior en inglés que en el resto de las lenguas. Esto se debe a que tanto los principales desarrollos científicos como las grandes empresas que los han explotado comercialmente se han creado en países angloparlantes y entrenado con datos en inglés.
La realidad lingüística es muy distinta de la tecnológica: el español es el segundo idioma del mundo y cuenta con más de 585 millones de hablantes y un crecimiento del 7,5 % anual. Aun así, no existe una inteligencia artificial hoy que sea capaz de procesar con calidad sus numerosas variantes (debidas a diferentes circunstancias geográficas, sociales o contextuales).
La razón de este retraso con respecto al inglés se debe a la fragmentación de las empresas de tecnología lingüística hispanas. En general, son pequeñas y están orientadas a funciones específicas y muy concretas, con un histórico fuertemente vinculado a la traducción y a la variedad lingüística peninsular.
Además, a pesar de la gran cantidad de datos que poseemos en nuestra lengua, estos no se encuentran disponibles para su explotación, pues muchos son privados. Incluso aquellos que están en manos de las instituciones públicas y culturales se encuentran en silos no preparados para su consumo abierto.
Por estos motivos, en muchas ocasiones, las empresas y los grandes clientes eligen soluciones que no se han fabricado en nuestra lengua ni entrenado con nuestros datos, sino mediante la traducción posterior. Esto hace que su nivel de éxito sea mucho menor.
He aquí algunos ejemplos: para poder entrenar a un robot en el ámbito legal español, es necesario contar con abundantes textos legales en nuestra lengua, pero también de un conocimiento del Derecho Romano y del funcionamiento de la jurisprudencia en España.
Para poder discernir las diferentes variedades del español en Latinoamérica, es imprescindible conocer no solamente las variantes de léxico, sino también la fonética, e incluso el funcionamiento situacional (pragmática) de algunas expresiones en determinados contextos. Todos estos matices se pierden en la traducción.
Una oportunidad para el avance
A pesar de todo, nos encontramos hoy en un momento de interés creciente por el desarrollo de la inteligencia artificial aplicada al lenguaje. Ha habido un incremento del 34,5 % de papers científicos sobre procesamiento del lenguaje natural e IA aplicado a lenguaje entre 2019 y 2020, que hace patente la creciente madurez de la tecnología.
Además, el interés por su desarrollo se ha convertido en clave para el desarrollo económico. Actualmente, China lidera con fuerza la revolución tecnológica, seguida por Estados Unidos. Mientras, Europa lucha por no quedar más rezagada buscando nichos para brillar ligados a nuevas oportunidades y a la propia realidad cultural, económica e histórica del viejo continente. La lengua es, sin lugar a dudas, una de ellas, pues los activos que sirven de punto de partida, los datos, están aquí y prácticamente no se han aprovechado aún.
Dentro de esta carrera por el desarrollo de la inteligencia artificial, la importancia del español como lengua nativa de IA, ligada al potencial de mercado y a la riqueza y variedad de sus datos, es una mina de oro que apenas se ha comenzado a explotar.
No es necesario reinventar la pólvora, tan solo proporcionar datos abiertos y disponibles para poder entrenar los algoritmos existentes y alinear el tejido empresarial hacia una misma dirección.
El objetivo es crear una inteligencia artificial tan poderosa como el número de hablantes de español, que allanaría el camino no solo para crear nuevas empresas y mejores algoritmos, sino también para la digitalización y preservación digital de un acervo cultural, lingüístico e histórico que merece un espacio privilegiado dentro del futuro de la transformación digital internacional. El momento es ahora, y los responsables, nosotros.
![]()
Elena González-Blanco no recibe salario, ni ejerce labores de consultoría, ni posee acciones, ni recibe financiación de ninguna compañía u organización que pueda obtener beneficio de este artículo, y ha declarado carecer de vínculos relevantes más allá del cargo académico citado.
The Conversation. Rigor académico, oficio periodístico
Compártelo:
Me gusta esto:
Este periodismo no lo financian bancos ni partidos
Lo sostienen personas como tú. En un contexto de ruido, propaganda y desinformación, hacer periodismo crítico, independiente y sin miedo tiene un coste.
Si este artículo te ha servido, te ha informado o te ha hecho pensar, puedes ayudarnos a seguir publicando.
Cada aportación cuenta. Sin intermediarios. Sin líneas rojas impuestas. Solo periodismo sostenido por su comunidad.
Related posts
SÍGUENOS
El Financial Times retrata el Madrid de Ayuso: una capital convertida en escaparate para ricos
El Financial Times ha puesto palabras —y bastante incómodas— a lo que en Madrid se ve desde hace tiempo caminando por sus barrios: la capital se ha convertido en una ciudad de moda, sí, pero también en una máquina de triturar vida cotidiana. El diario británico, fundado en 1888 y con más de dos millones de lectores diarios, ha dedicado un amplio reportaje a la Comunidad de Madrid y a la transformación de una ciudad que ya no se vende solo como capital administrativa, sino como refugio dorado para turistas, inversores, nómadas digitales y fortunas extranjeras.
El enlace al análisis original es este: https://www.ft.com/content/8955cbef-afe8-4c9f-8381-b279c7f4c2c0
La postal es muy bonita, claro. Fachadas luminosas, terrazas llenas, museos, gastronomía, sol, barrios “vibrantes”, ese vocabulario tan de folleto para gente que puede pagar 3.000 euros al mes por vivir donde antes vivía una familia trabajadora. Pero detrás del brillo aparece la pregunta de siempre. La pregunta sucia. ¿Quién gana con este modelo y quién se queda mirando desde fuera?
Porque Madrid crece. Madrid atrae. Madrid se llena de dinero. Pero no todo crecimiento es prosperidad. A veces es simplemente expulsión con camareros sonrientes, copas caras y apartamentos turísticos.
Siempre es igual: tocar poder para cobrar más
Siempre es igual. Llegan hablando de “gasto político”, de “burocracia”, de “chiringuitos”, de “administración elefantiásica”. Llegan con la motosierra en la boca y la calculadora en el bolsillo. Pero cuando pisan moqueta, la motosierra desaparece. La calculadora, no. La calculadora sirve para otra cosa: para repartir cargos, levantar nuevas direcciones generales, abrir despachos, colocar nombres y convertir la promesa de austeridad en una nómina pública más abultada.
El segundo Gobierno de coalición de PP y Vox en Castilla y León no ha venido a adelgazar nada. Ha venido a ocupar. El 29 de junio, en un Consejo de Gobierno extraordinario que ni siquiera fue comunicado previamente, el Ejecutivo de Alfonso Fernández Mañueco aprobó una nueva estructura autonómica que rompe su propio techo: por primera vez, los altos cargos superarán el centenar. La derecha que decía venir a desmontar el “gasto político” acaba de construir una administración con al menos 105 personas en la cúpula: presidente, vicepresidenta, diez consejeros y consejeras, once viceconsejerías, diez secretarías generales, 63 direcciones generales o cargos asimilados y nueve delegados territoriales.
El PP agita el fantasma del pucherazo contra los nietos del exilio
Alberto Núñez Feijóo llamó este lunes 29 de junio “ingeniería electoral” a la llamada ley de nietos. Conviene traducirlo: el Partido Popular ha decidido presentar como maniobra oscura una vía de nacionalización incluida en la Ley de Memoria Democrática, vigente desde 2022, que permite obtener la nacionalidad española a descendientes de personas exiliadas durante el franquismo y otros periodos históricos. No hay pruebas de pucherazo. No hay una trama acreditada. No hay una manipulación demostrada. Hay, otra vez, una derecha fabricando sospecha sobre el voto cuando teme que las urnas no le pertenezcan.
La acusación no nace sola. Vox abrió el camino y el PP se colocó al lado sin demasiados remilgos. Feijóo lanzó la idea en el programa de Federico Jiménez Losantos: Pedro Sánchez estaría buscando “nuevos votantes” porque “no le salen las cuentas”. Viejo truco. Si votan los míos, democracia. Si pueden votar otros, ingeniería. El sufragio deja de ser un derecho y pasa a ser una amenaza cuando no se puede controlar políticamente.
Vídeo | Más de 1.000.000 de personas han visto nuestra denuncia ‘Fábrica de obediencia’
Dicen que una bandera arcoíris “adoctrina” a la infancia. Pero meter a menores bajo una carpa para que lloren, griten, se arrodillen y aprendan obediencia lo llaman “avivamiento”.
Estrenamos nuevo reportaje de Spanish Revolution: “Tras la Nakba”, segunda parte de “Palestina y la historia que quieren borrar”.
La historia de Palestina no empezó el 7 de octubre de 2023. Y tampoco terminó en 1948 con la Nakba. Después vino 1967, la ocupación de Gaza, Cisjordania y Jerusalén Este, los checkpoints, los asentamientos, el muro, el bloqueo y una maquinaria de control que…
Seguir
Seguir
Seguir
Subscribe
Seguir