Este medio se sostiene gracias a su comunidad. APOYA EL PERIODISMO INDEPENDIENTE .
En la actualidad, nadie duda de las capacidades de ChatGPT para generar texto en un lenguaje coherente y natural. Tanto es así que lo que en un principio era un objetivo inalcanzable (generar texto humano) ha derivado en un desafío: ¿es posible distinguir un lenguaje generado por ChatGPT de uno generado por un humano?
Algunas de las herramientas publicadas hasta el momento se basan, por ejemplo, en analizar la aleatoriedad del texto, asumiendo que el texto generado por un humano será más caótico. Incluso desde la propia organización creadora de ChatGPT (OpenAI), se están desarrollando maneras de reconocer el texto generado por su modelo de lenguaje.
Además, al haber sido entrenado con textos, los estereotipos presentes en ellos serán adoptados por parte del modelo, introduciendo sesgos a la hora de generar su lenguaje. Se hace necesario, por tanto, trabajar en la equidad (fairness): desarrollar algoritmos que permitan detectar estos sesgos para aprender un modelo justo.
Su entrenamiento
ChatGPT ha sido entrenado con millones de textos de internet, entre los que podemos encontrar artículos de Wikipedia, noticias, libros…
Se calcula que se han utilizado alrededor de 300 000 millones de palabras para su entrenamiento. Al ser un modelo de lenguaje, su funcionamiento se basa en calcular las posibles palabras que vienen a continuación de una dada, y devolver aquella que mayor probabilidad tiene. Esto se realiza a través de un proceso previo de comprobación supervisado en el que se enseña al modelo cuáles son las palabras que vendrían después. Se introduce una frase y, en el caso de que el modelo dé una respuesta incorrecta, se le dará la respuesta válida. De esta manera aprende qué debe decir.
¿Y si los textos están sesgados?
El hecho de que haya sido entrenado con dichos textos lleva irremediablemente a una cuestión, ¿qué ocurre si los textos están sesgados? Podría ocurrir, y de hecho así es, que en los datos de entrenamiento se transmitan ideas o estereotipos presentes en la sociedad dado que es lo que estaba presente en los textos. Como en cualquier modelo de inteligencia artificial, los sesgos en el conjunto de entrenamiento se transmitirán al comportamiento del modelo una vez entrenado.
Cabría esperar que una herramienta tan potente estuviera destinada solamente a profesionales dedicados a la inteligencia artificial. Sin embargo, cualquier persona con conexión a internet puede utilizarla a través de la plataforma en la que está integrada .
Una inteligencia artificial para detectar a otra inteligencia artificial
Uno de los mayores desafíos que plantean modelos como este es el fraude en su utilización.
¿Es posible detectar un texto escrito por ChatGPT? En la actualidad ya se han desarrollado herramientas para detectar si un texto ha sido o no escrito por un modelo de lenguaje. Aunque también es cierto que no siempre aciertan. Una manera utilizada en la actualidad es el análisis de la perplejidad o, lo que es lo mismo, de la aleatoriedad presente en el texto. Esta medida indica el grado de desorden que hay en un texto. Una perplejidad alta indica mayor probabilidad de que el texto haya sido generado por una persona real. Por lo tanto, cuanta mayor es la extensión del texto, mayor es la fiabilidad de la herramienta de detección (una mayor extensión proporcionará mayor información del grado desorden).
Otro método, recientemente publicado en un artículo por investigadores de la Universidad de Stanford, se basa en el método estadístico curvatura de probabilidad. Según se indica en el artículo, el texto generado por una inteligencia artificial tiene una curvatura negativa en su función de probabilidad logarítmica. Esto contrasta con el texto generado por los humanos, que tendría una curvatura positiva.
Es decir: en muchas ocasiones, las herramientas de detección de fraude son una inteligencia artificial para detectar a otra inteligencia artificial.
La propia organización creadora de ChatGPT, OpenAI, ya está trabajando en el desarrollo de marcas de agua en los textos generados: signos imperceptibles para la persona humana pero detectables a través de herramientas informáticas que indiquen si el autor del texto es un humano o una inteligencia artificial.
Cuando quisimos prohibir las calculadoras
El debate actual se asemeja en cierta medida al que hubo acerca de la utilización de las calculadoras. En lugar de prohibirlas, se consiguió integrarlas en el aprendizaje y enseñar a utilizarlas para sacarles el máximo partido. La situación con ChatGPT es análoga, el reto es integrar esta tecnología en la docencia y poder explotar sus capacidades, siendo conscientes del gran potencial que tiene. Para ello, habrá que idear maneras de evaluar el aprendizaje que utiliza herramientas como esta.
El modelo presenta algunos peligros, que principalmente consisten en el fraude académico a través del plagio y los sesgos. De la misma manera que ocurre en otros modelos de inteligencia artificial, ChatGPT toma unos datos (en este caso texto escrito) para su entrenamiento. En consecuencia, el comportamiento que presente está condicionado por lo aprendido con esos textos. Por ejemplo, en el hipotético caso de que en todos los textos de entrenamiento que traten sobre sentencias judiciales se afirmara que una persona es culpable o no dependiendo de su raza, el modelo aprendería esta regla. Y si se le preguntara cómo determinar si una persona es culpable, respondería que en función de su raza.
El sesgo en los datos
Por todo ello, los estudios se centran ahora en la manera de aprender de los datos teniendo en cuenta los sesgos presentes, y equilibrando la balanza a favor de esa equidad (llamada fairness).
Desde DATAI, el Instituto de Ciencia de Datos e Inteligencia Artificial de la Universidad de Navarra, se están desarrollando trabajos de investigación acerca del fairness en las decisiones tomadas mediante un algoritmo. Con frecuencia el sesgo está más en los datos que en el algoritmo y por eso se busca detectar ese sesgo en los datos y repararlo de modo automático. Además, también hay un grupo de investigadores trabajando en el desarrollo de un motor de inteligencia artificial que permita extraer un modelo de personalidad a través de un texto utilizando procesamiento del lenguaje natural.
A pesar de los riesgos que puede conllevar, ChatGPT supone un gran avance en el ámbito científico. La cuestión radica en conocer sus capacidades, beneficiarse de ellas y combatir los peligros que implica. De este modo, dejará de ser una amenaza para convertirse en una ayuda con un gran potencial.
Eduardo Iribas Jimeno recibe fondos del Programa MRR Investigo del Gobierno de Navarra.
Este periodismo no lo financian bancos ni partidos
Lo sostienen personas como tú. En un contexto de ruido, propaganda y desinformación, hacer periodismo crítico, independiente y sin miedo tiene un coste.
Si este artículo te ha servido, te ha informado o te ha hecho pensar, puedes ayudarnos a seguir publicando.
Cada aportación cuenta. Sin intermediarios. Sin líneas rojas impuestas. Solo periodismo sostenido por su comunidad.
Related posts
SÍGUENOS
Marlaska descubre la dignidad policial cuando el golpe viene de Peinado
El caso Begoña Gómez se ha convertido ya en una trituradora institucional. Peinado empuja desde un juzgado una causa que cada día parece más atravesada por el ruido político. El Gobierno responde con comunicados, quejas y gestos de trinchera. La derecha agita el expediente como si hubiera encontrado petróleo. Y en medio, otra vez, el Estado se mira a sí mismo. Sus jueces. Sus policías. Sus ministros. Sus sindicatos. Su honor.
Pero la calle queda fuera de plano.
La misma calle que ha visto cargas policiales contra protestas sociales, desahucios, movilizaciones antifascistas, marchas laborales o concentraciones por Palestina. La misma calle donde se reparte autoridad a golpe de defensa extensible. La misma calle a la que luego se le pide confianza institucional, moderación y respeto.
Ayuso convierte la maternidad en trinchera ideológica con su “ley del concebido no nacido”
Isabel Díaz Ayuso ha anunciado que el próximo 2 de julio llevará a la Asamblea de Madrid un pleno extraordinario para debatir y aprobar la llamada “ley del concebido no nacido”. No es una anécdota parlamentaria. No es una medida técnica. Es una pieza más en la ofensiva reaccionaria que intenta reescribir los derechos sexuales y reproductivos con lenguaje administrativo, una carpeta institucional y una sonrisa de superioridad moral.
La propuesta reconoce al “concebido no nacido” como “miembro más de la unidad familiar”. Dicho así parece una fórmula burocrática. Pero no lo es. Es política pura. Y de la más peligrosa: la que pretende colarse por la puerta de las ayudas sociales para instalar una visión ultraconservadora de la maternidad, del cuerpo de las mujeres y de la familia. No están ampliando derechos: están moviendo el marco para que el embarazo pese jurídicamente antes que la vida material de las mujeres.
El pacto entre EE.UU. e Irán redibuja Oriente Medio y deja a Israel mirando el desastre
El acuerdo entre Estados Unidos e Irán, firmado el 18 de junio por Donald Trump y Masoud Pezeshkian, ya tiene su etiqueta grandilocuente: el “gran pacto”, el “acuerdo del siglo”, la jugada histórica que supuestamente cerraría una etapa de guerra y abriría otra de negociación. La liturgia también fue cuidadosamente escogida. Trump lo formalizó en Versalles, al margen de la cumbre del G7, como si el decorado imperial pudiera maquillar lo evidente: las potencias no reconstruyen el orden internacional, lo reparten.
Es el primer pacto firmado por un presidente estadounidense y un presidente iraní desde la Revolución Islámica de 1979. No es un detalle menor. Tiene 14 puntos, prolonga el alto el fuego durante 60 días, incluye a Líbano y abre la puerta a negociar un arreglo permanente, incluido el programa nuclear iraní. Dicho así parece diplomacia. Pero la diplomacia, cuando llega después de miles de muertos, suele ser el nombre elegante del fracaso moral.
Vídeo | Estrenamos este domingo la segunda parte del reportaje “Palestina y la historia que quieren borrar”
Spanish Revolution estrena este domingo a las 15:00 la segunda parte de “Palestina y la historia que quieren borrar”, el reportaje dirigido y presentado por Patricia Salvador dentro de #ReportajesSR, el proyecto audiovisual dirigido por Patricia Salvador y Lea Guggelman.
Bajo el título “La Nakba eterna”, esta nueva entrega continúa el recorrido iniciado en el primer capítulo, donde se abordaba la Nakba para desmontar la mentira de que la historia de Palestina comienza el 7 de octubre.
Vídeo | El turismo que saquea las ciudades mientras sonríe para la foto
El turismo urbano ya no puede seguir vendiéndose como una postal amable, una maleta con ruedas y una pareja haciéndose fotos frente a una fachada histórica. En demasiadas ciudades se ha convertido en otra cosa. En una forma educada de saqueo. Entra sonriendo, paga tres noches, deja propina si toca, sube una historia a Instagram y se marcha. Lo que queda detrás no sale en la foto: alquileres imposibles, vecinas expulsadas, comercios de barrio sustituidos por locales sin alma y calles que ya no pertenecen a quienes las habitan.
No es turismo. Es extracción.
Seguir
Seguir
Seguir
Subscribe
Seguir