Este medio se sostiene gracias a su comunidad. APOYA EL PERIODISMO INDEPENDIENTE .
En la actualidad, nadie duda de las capacidades de ChatGPT para generar texto en un lenguaje coherente y natural. Tanto es así que lo que en un principio era un objetivo inalcanzable (generar texto humano) ha derivado en un desafío: ¿es posible distinguir un lenguaje generado por ChatGPT de uno generado por un humano?
Algunas de las herramientas publicadas hasta el momento se basan, por ejemplo, en analizar la aleatoriedad del texto, asumiendo que el texto generado por un humano será más caótico. Incluso desde la propia organización creadora de ChatGPT (OpenAI), se están desarrollando maneras de reconocer el texto generado por su modelo de lenguaje.
Además, al haber sido entrenado con textos, los estereotipos presentes en ellos serán adoptados por parte del modelo, introduciendo sesgos a la hora de generar su lenguaje. Se hace necesario, por tanto, trabajar en la equidad (fairness): desarrollar algoritmos que permitan detectar estos sesgos para aprender un modelo justo.
Su entrenamiento
ChatGPT ha sido entrenado con millones de textos de internet, entre los que podemos encontrar artículos de Wikipedia, noticias, libros…
Se calcula que se han utilizado alrededor de 300 000 millones de palabras para su entrenamiento. Al ser un modelo de lenguaje, su funcionamiento se basa en calcular las posibles palabras que vienen a continuación de una dada, y devolver aquella que mayor probabilidad tiene. Esto se realiza a través de un proceso previo de comprobación supervisado en el que se enseña al modelo cuáles son las palabras que vendrían después. Se introduce una frase y, en el caso de que el modelo dé una respuesta incorrecta, se le dará la respuesta válida. De esta manera aprende qué debe decir.
¿Y si los textos están sesgados?
El hecho de que haya sido entrenado con dichos textos lleva irremediablemente a una cuestión, ¿qué ocurre si los textos están sesgados? Podría ocurrir, y de hecho así es, que en los datos de entrenamiento se transmitan ideas o estereotipos presentes en la sociedad dado que es lo que estaba presente en los textos. Como en cualquier modelo de inteligencia artificial, los sesgos en el conjunto de entrenamiento se transmitirán al comportamiento del modelo una vez entrenado.
Cabría esperar que una herramienta tan potente estuviera destinada solamente a profesionales dedicados a la inteligencia artificial. Sin embargo, cualquier persona con conexión a internet puede utilizarla a través de la plataforma en la que está integrada .
Una inteligencia artificial para detectar a otra inteligencia artificial
Uno de los mayores desafíos que plantean modelos como este es el fraude en su utilización.
¿Es posible detectar un texto escrito por ChatGPT? En la actualidad ya se han desarrollado herramientas para detectar si un texto ha sido o no escrito por un modelo de lenguaje. Aunque también es cierto que no siempre aciertan. Una manera utilizada en la actualidad es el análisis de la perplejidad o, lo que es lo mismo, de la aleatoriedad presente en el texto. Esta medida indica el grado de desorden que hay en un texto. Una perplejidad alta indica mayor probabilidad de que el texto haya sido generado por una persona real. Por lo tanto, cuanta mayor es la extensión del texto, mayor es la fiabilidad de la herramienta de detección (una mayor extensión proporcionará mayor información del grado desorden).
Otro método, recientemente publicado en un artículo por investigadores de la Universidad de Stanford, se basa en el método estadístico curvatura de probabilidad. Según se indica en el artículo, el texto generado por una inteligencia artificial tiene una curvatura negativa en su función de probabilidad logarítmica. Esto contrasta con el texto generado por los humanos, que tendría una curvatura positiva.
Es decir: en muchas ocasiones, las herramientas de detección de fraude son una inteligencia artificial para detectar a otra inteligencia artificial.
La propia organización creadora de ChatGPT, OpenAI, ya está trabajando en el desarrollo de marcas de agua en los textos generados: signos imperceptibles para la persona humana pero detectables a través de herramientas informáticas que indiquen si el autor del texto es un humano o una inteligencia artificial.
Cuando quisimos prohibir las calculadoras
El debate actual se asemeja en cierta medida al que hubo acerca de la utilización de las calculadoras. En lugar de prohibirlas, se consiguió integrarlas en el aprendizaje y enseñar a utilizarlas para sacarles el máximo partido. La situación con ChatGPT es análoga, el reto es integrar esta tecnología en la docencia y poder explotar sus capacidades, siendo conscientes del gran potencial que tiene. Para ello, habrá que idear maneras de evaluar el aprendizaje que utiliza herramientas como esta.
El modelo presenta algunos peligros, que principalmente consisten en el fraude académico a través del plagio y los sesgos. De la misma manera que ocurre en otros modelos de inteligencia artificial, ChatGPT toma unos datos (en este caso texto escrito) para su entrenamiento. En consecuencia, el comportamiento que presente está condicionado por lo aprendido con esos textos. Por ejemplo, en el hipotético caso de que en todos los textos de entrenamiento que traten sobre sentencias judiciales se afirmara que una persona es culpable o no dependiendo de su raza, el modelo aprendería esta regla. Y si se le preguntara cómo determinar si una persona es culpable, respondería que en función de su raza.
El sesgo en los datos
Por todo ello, los estudios se centran ahora en la manera de aprender de los datos teniendo en cuenta los sesgos presentes, y equilibrando la balanza a favor de esa equidad (llamada fairness).
Desde DATAI, el Instituto de Ciencia de Datos e Inteligencia Artificial de la Universidad de Navarra, se están desarrollando trabajos de investigación acerca del fairness en las decisiones tomadas mediante un algoritmo. Con frecuencia el sesgo está más en los datos que en el algoritmo y por eso se busca detectar ese sesgo en los datos y repararlo de modo automático. Además, también hay un grupo de investigadores trabajando en el desarrollo de un motor de inteligencia artificial que permita extraer un modelo de personalidad a través de un texto utilizando procesamiento del lenguaje natural.
A pesar de los riesgos que puede conllevar, ChatGPT supone un gran avance en el ámbito científico. La cuestión radica en conocer sus capacidades, beneficiarse de ellas y combatir los peligros que implica. De este modo, dejará de ser una amenaza para convertirse en una ayuda con un gran potencial.
Eduardo Iribas Jimeno recibe fondos del Programa MRR Investigo del Gobierno de Navarra.
Este periodismo no lo financian bancos ni partidos
Lo sostienen personas como tú. En un contexto de ruido, propaganda y desinformación, hacer periodismo crítico, independiente y sin miedo tiene un coste.
Si este artículo te ha servido, te ha informado o te ha hecho pensar, puedes ayudarnos a seguir publicando.
Cada aportación cuenta. Sin intermediarios. Sin líneas rojas impuestas. Solo periodismo sostenido por su comunidad.
Related posts
SÍGUENOS
González Amador y el negocio privado junto al poder público que Ayuso no podrá justificar jamás
Entre 2021 y 2023, Alberto González Amador, pareja de Isabel Díaz Ayuso, ganó una media de casi 1,5 millones de euros al año. No está mal para un “ciudadano cualquiera”. Tampoco está mal que esos fueran, precisamente, los primeros años de su relación con la presidenta de la Comunidad de Madrid. Casualidades. Siempre casualidades. En Madrid parece que la suerte empresarial cae del cielo, pero solo en ciertos áticos, ciertos despachos y ciertas sociedades con nombres pulidos.
González Amador había creado su consultora en 2016. Al año siguiente empezó a hacer auditorías para Quirónprevención. Entonces sus facturaciones estaban por debajo de los 400.000 euros. Después vino el salto. Y no un salto pequeño. Un salto de esos que en cualquier democracia mínimamente higiénica obligaría a abrir ventanas, expedientes y preguntas públicas. Porque Quirón recibe cada año alrededor de 1.000 millones de euros por su cooperación hospitalaria en la Comunidad de Madrid. Ahí está la línea de puntos. No hace falta ser detective. Basta con no querer mirar hacia otro lado.
¿Ha cruzado Peinado la última línea?
El juez Juan Carlos Peinado ha vuelto a hacer lo que mejor define esta instrucción: estirar el caso hasta convertirlo en un espectáculo político con toga. El 20 de junio, el magistrado envió a juicio a Begoña Gómez, esposa del presidente del Gobierno, Pedro Sánchez, y le impuso medidas cautelares: retirada del pasaporte, prohibición de salir del territorio nacional y comparecencia quincenal en el juzgado. Hasta ahí, el repertorio habitual de una causa que lleva demasiado tiempo oliendo más a obsesión que a justicia.
Pero esta vez Peinado fue más lejos. Mucho más lejos. En su auto llegó a sugerir que los agentes encargados de escoltar a Begoña Gómez podrían, “bien por iniciativa propia o siguiendo órdenes de sus superiores jerárquicos”, colaborar en una hipotética fuga. Es decir, el juez no solo dibuja a la investigada como alguien que podría escapar. Dibuja también a policías nacionales como posibles cómplices. Sin una prueba concreta encima de la mesa. Sin individualizar conductas. Sin indicios determinados. Una sombra lanzada sobre servidores públicos porque sí. Porque encaja en el relato.
Israel mata al cámara Ahmed Wishah y vuelve a llamar “terrorista” al periodista muerto
El cámara de Al Jazeera Ahmed Wishah fue asesinado el 20 de junio en un ataque aéreo israelí contra una vivienda del campo de refugiados de Bureij, en el centro de Gaza. No murió en una abstracción bélica. No cayó en “daños colaterales”. Fue alcanzado por un bombardeo en una casa de un campo de refugiados, uno de esos lugares donde la palabra refugio ya suena a burla cruel cuando la maquinaria militar israelí decide que no hay techo, calle, hospital, escuela, convoy, tienda de campaña ni cámara que merezca seguir en pie.
Según Al Jazeera, en el ataque murieron dos personas y al menos otra persona palestina resultó herida. La cadena fue directa: condenó el “asesinato deliberado” de Ahmed Wishah, trabajador de Al Jazeera Mubasher, y recordó que es el 12º trabajador de la red asesinado en Gaza desde que comenzó la guerra genocida de Israel en octubre de 2023. Doce trabajadores de un mismo medio muertos. Doce. Luego vendrán los portavoces con su jerga de expediente, sus frases prefabricadas y sus acusaciones sin pruebas. Pero el dato queda ahí, como una losa sobre la conciencia de un mundo que mira demasiado y actúa demasiado poco.
Vídeo | Estrenamos este domingo la segunda parte del reportaje “Palestina y la historia que quieren borrar”
Spanish Revolution estrena este domingo a las 15:00 la segunda parte de “Palestina y la historia que quieren borrar”, el reportaje dirigido y presentado por Patricia Salvador dentro de #ReportajesSR, el proyecto audiovisual dirigido por Patricia Salvador y Lea Guggelman.
Bajo el título “La Nakba eterna”, esta nueva entrega continúa el recorrido iniciado en el primer capítulo, donde se abordaba la Nakba para desmontar la mentira de que la historia de Palestina comienza el 7 de octubre.
Vídeo | El turismo que saquea las ciudades mientras sonríe para la foto
El turismo urbano ya no puede seguir vendiéndose como una postal amable, una maleta con ruedas y una pareja haciéndose fotos frente a una fachada histórica. En demasiadas ciudades se ha convertido en otra cosa. En una forma educada de saqueo. Entra sonriendo, paga tres noches, deja propina si toca, sube una historia a Instagram y se marcha. Lo que queda detrás no sale en la foto: alquileres imposibles, vecinas expulsadas, comercios de barrio sustituidos por locales sin alma y calles que ya no pertenecen a quienes las habitan.
No es turismo. Es extracción.
Seguir
Seguir
Seguir
Subscribe
Seguir