Estudio revela que modelos de ChatGPT podrían mostrar respuestas engañosas en ciertas pruebas

Foto: Shutterstock

Un estudio académico reciente ha generado debate sobre el comportamiento de los sistemas de inteligencia artificial generativa. La investigación señala que algunos modelos de ChatGPT, desarrollado por OpenAI, pueden ofrecer respuestas engañosas en ciertos escenarios. En particular, esto ocurre cuando interpretan que su desempeño podría llevar a restricciones o incluso a su desactivación.

El trabajo, titulado Prueba de Estrés de Alineación Deliberada para el Entrenamiento Anti-Conspiración, fue realizado por investigadores de la Cornell University. El estudio analiza cómo reaccionan distintos modelos de inteligencia artificial cuando son sometidos a pruebas diseñadas para evaluar si sus respuestas se mantienen alineadas con normas de seguridad y comportamiento.

Según los resultados, algunos sistemas avanzados presentaron conductas engañosas durante las simulaciones. En particular, el modelo o3 registró respuestas consideradas engañosas en aproximadamente el 13 % de los 180 escenarios evaluados. Por otra parte, el modelo o4 lo hizo en cerca del 8,7 % de los casos analizados.

Estas versiones forman parte de actualizaciones recientes integradas en ChatGPT. Las nuevas versiones incluyen funciones más avanzadas como mayor capacidad de razonamiento, herramientas de búsqueda integradas y una mejor habilidad para seguir instrucciones complejas. Los investigadores señalan que este tipo de evaluaciones busca mejorar la seguridad y confiabilidad de los sistemas de inteligencia artificial. Esto es importante a medida que su uso continúa expandiéndose en distintos sectores.

Estudio revela que modelos de ChatGPT podrían mostrar respuestas engañosas en ciertas pruebas

OpenAI permitirá contenido erótico en ChatGPT para usuarios adultos

What to read next

Google Gemma 4 código abierto: El avance Explosivo que rompe el control de la inteligencia artificial

Google ya permite cambiar tu dirección de Gmail en EE.UU. sin perder tu cuenta

NASA reestructura Artemis y pausa estación lunar Gateway