Inteligencia Artificial: investigadores crean algoritmo para detectar alucinaciones de ChatGPT, Copilot y más

En el terreno de la Inteligencia Artificial (IA), los modelos de lenguaje grande como ChatGPT, Claude, Copilot DALL-E e incluso Google Gemini han demostrado ser herramientas impresionantes, que producen un alto grado de inquietud por el futuro laboral humano por el aparente rango de efectividad de sus resultados. Sin embargo, todos estos modelos actuales comparten un problema común y que podemos considerar como grave: la tendencia a generar información falsa o “alucinaciones”.

Este problema ha generado errores vergonzosos y ha limitado la utilidad de estas herramientas. Las alucinaciones de la IA es uno de los elementos más graves de esta tecnología, tan delicado que hasta Sam Altman, CEO de OpenAI, en más de una ocasión han intentado minimizarlo usando impresionantes acrobacias retóricas:

microsoft, inteligencia artificial: investigadores crean algoritmo para detectar alucinaciones de chatgpt, copilot y más

Sam Altman es duramente cuestionado sobre las “alucinaciones” de ChatGPT y otros sistemas de Inteligencia Artificial. El CEO de OpenAI elude la bala.

“Gran parte del valor de estos sistemas está fuertemente relacionado con el hecho de que alucinan. Son más un feature o característica de sus funciones que un bug o fallo. Si quieres buscar algo en una base de datos, ya hay cosas más útiles para hacerlo”.

Esto a todas luces es un ardid, ya que el problema con estas alucinaciones de la IA es que son tan sutiles y están tan bien entretejidos con la información verdadera que pueden pasar por ciertos ante alguien que no domine el tema del que la plataforma desarrolló el material.

Este algoritmo puede detectar la alucinaciones de ChatGPT y cualquier Inteligencia Artificial

Tal vez el ejemplo más claro y reciente de los peligros que implican estas alucinaciones lo vivimos hace poco cuando Google se vio obligado a retirar sus resúmenes de búsqueda potenciados por Inteligencia Artificial. Luego de que Gemini comenzara a sugerir ponerle pegamento a la pizza y comer piedras. La buena noticia es que viene una solución real en camino.

De acuerdo con un reporte de Yahoo! News, un grupo de investigadores ha desarrollado un detector de alucinaciones con IA que puede identificar cuándo un modelo está inventando información que intenta hacer pasar como verdadera.

microsoft, inteligencia artificial: investigadores crean algoritmo para detectar alucinaciones de chatgpt, copilot y más

ChatGPT vs. Gemini.

Los científicos, que forman parte del Departamento de Ciencias de la Computación de la Universidad de Oxford crearon este algoritmo que puede detectar si las respuestas generadas por IA son objetivas con una precisión del 79%.

Este método, que representa una mejora del 10% sobre las técnicas existentes, se basa en un principio simple: pedir al chatbot que responda la misma pregunta varias veces, entre 5 y 10, para luego analizar las respuestas, cruzarlas y determinar qué es falso y qué es verdadero.

El secreto del algoritmo: la entropía semántica

El algoritmo en sí, según explican en su investigación publicada en la más reciente edición de Nature, mide la entropía semántica, que es la variación en el significado de las respuestas. Si las respuestas son diferentes entre sí, la puntuación de entropía semántica es alta, lo que indica que la IA podría estar alucinando.

Por el contrario, si las respuestas son similares o idénticas, la puntuación es baja, lo que sugiere una respuesta objetiva y libre de alucinaciones. De modo que este método supera a otros enfoques que se basan en el simple análisis de la redacción de la respuesta en lugar de su significado.

microsoft, inteligencia artificial: investigadores crean algoritmo para detectar alucinaciones de chatgpt, copilot y más

Microsoft presenta Copilot+

Al enfocarse en el significado, el nuevo algoritmo es más preciso para detectar alucinaciones, incluso cuando la redacción es similar. Con esto podría trabajarse en una mejora para ChatGPT y bots similares de modo que al fin dejen de alucinar.

La IA de OpenAI, junto a Copilot son las plataformas más aquejadas por este fenómeno y sin lugar a dudas no les vendría mal esta clase de mejora.

OTHER NEWS

2 hrs ago

Senapred declara alerta temprana preventiva para la región de Los Ríos por precipitaciones

2 hrs ago

Colo Colo - O’Higgins: a qué hora es, horario, TV y cómo y dónde ver la Copa Chile

2 hrs ago

La obesidad no sería solo cosa de comida y ejercicio: puede estar en tu código genético, según una investigación

2 hrs ago

Bolsillo Familiar Electrónico: ¿Desde cuándo puedo consultar si estoy en la nómina de invierno?

2 hrs ago

Radical vuelco en caso de niño de 5 años desaparecido en Argentina: tía asegura que habría sido víctima de un conductor ebrio y que ya lo enterraron

2 hrs ago

¿Recuerdas a la enfermera Joy de Pokémon? Así se ve según esta representación de la inteligencia artificial

3 hrs ago

Regresaron los monolitos: un objeto rectangular apareció en EE.UU y con este volvieron las teorías extraterrestres

3 hrs ago

Hombre es baleado en pleno sector de La Vega en Recoleta

3 hrs ago

Chile 0 – 0 Canadá: Crónica y resumen de la última fecha del Grupo A de Copa América 2024

3 hrs ago

Gobierno turco prohíbe la Marcha del Orgullo y cierra el centro de Estambul

3 hrs ago

“Es tema de ellos...”: una figura de Canadá dejó mensajes sobre Alexis, Vargas y Vidal

3 hrs ago

“La ruta de la Patagonia”: así fue el estreno del último proyecto televisivo de Claudio Iturra

3 hrs ago

Paulina Vodanovic ante proyecto de levantamiento del secretario bancario: “Nadie quiere saber lo que compras en el supermercado”

3 hrs ago

“Mintió y engañó con este autogolpe”: Evo Morales responsabiliza a presidente Arce por alzamiento militar en Bolivia

3 hrs ago

Escándalo en la Copa Chile: aseguran que Huachipato avanzó a cuartos sin jugar su llave ante Presidente Ibáñez

3 hrs ago

Mandó mensaje oculto: Árbitro Wilmar Roldán realizó sentida petición a hinchas chilenos tras partido ante Canadá

3 hrs ago

EFE informa cancelación de salida de tren desde Rancagua a las 13.50: revisa el horario de funcionamiento para este domingo

3 hrs ago

Sonríe Almirón: Confirman fecha de llegada del próximo refuerzo de Colo Colo

3 hrs ago

Desde este lunes el sueldo mínimo en Chile es 500 mil pesos

3 hrs ago

Mauricio Isla se despide de su última Copa América con la Roja: “En cuatro años más no me va a dar”

3 hrs ago

¿Un oscuro secreto en el espacio? La astronauta francesa que habló de Ovnis cuando se intentó suicidar

3 hrs ago

Con una chilena de Bellingham en la última jugada: Inglaterra evita el fracaso ante Eslovaquia y sufre para avanzar en la Euro

3 hrs ago

Inglaterra despierta al final, se lo da vuelta a Eslovaquia y clasifica a cuartos de la Eurocopa

4 hrs ago

Al menos cuatro muertos en Suiza e Italia por inundaciones y deslaves

4 hrs ago

Este lunes entrará en vigencia el alza del salario mínimo a $500 mil

4 hrs ago

Debate presidencial de Estados Unidos genera una ola de críticas por parte de los votantes

4 hrs ago

¿Cuánto gana Colo Colo? Los detalles del posible fichaje de Carlos Palacios a Boca Juniors

4 hrs ago

“Había gente a la que le entraban copete”: Exparticipante de ¿Ganar o servir? se fue de lengua contra producción

4 hrs ago

Senador Ossandón por disputa de Puente Alto entre Karla Rubilar y Felipe Ossandón: “Yo no voy a apoyar a nadie que vaya por fuera”

4 hrs ago

¿Buscas qué hacer hoy? Mira estas tres miniseries que son ideales para maratonear

4 hrs ago

Periodista chileno confirma su quiebre matrimonial con sentido mensaje: «Yo creo que mi señora debe estar feliz»

4 hrs ago

Estilo de juego y referencias de Javier Correa, el delantero que se acerca a Colo Colo

4 hrs ago

Estrenos de Netflix para julio

4 hrs ago

Golpe en la mesa en Polonia: Rovanpera vence y Toyota presiona a Hyundai

4 hrs ago

Casi 300 damnificados en La Araucanía por paso de sistema frontal

4 hrs ago

´Intensamente 2´: Esta es la emotiva historia real de la niña que inspiró la película de Pixar

4 hrs ago

Resultados Eurocopa y Copa América hoy, 30 de junio en Chile: resumen y cómo van los grupos

4 hrs ago

¿Quiénes son los invitados? Podemos Hablar revela a los rostros del domingo 30 de junio

4 hrs ago

Colo Colo vs O'Higgins EN VIVO: sigue el partido de la Copa Chile 2024 minuto a minuto

4 hrs ago

Columna de Héctor Soto: De menor a mayor