OpenAI revela sus pautas para definir el comportamiento óptimo de una inteligencia artificial
OpenAI ha presentado un documento que servirá como guía para definir el comportamiento de sus modelos de inteligencia artificial. Este documento, conocido como Model Spec, aborda detalles cruciales sobre cómo los modelos de lenguaje responden a las consultas de los usuarios, incluyendo aspectos como tono, personalidad y duración de respuesta, entre otros.
El Model Spec es un compendio que contiene los objetivos fundamentales, reglas y valores predeterminados que moldean el comportamiento de los modelos de IA. Según OpenAI, este primer borrador detalla su enfoque para dar forma a los modelos, considerando diversas reglas para resolver conflictos potenciales.
Estas especificaciones funcionan como una suerte de plantilla que permite a expertos, investigadores y al público en general comprender cómo OpenAI aborda esta tecnología y cómo responde ante posibles fallos. A diferencia de otras empresas de inteligencia artificial como Meta y Apple, cuyos modelos son de código abierto, los modelos de OpenAI no lo son, lo que dificulta el análisis de su comportamiento.
Es por esto que Sam Altman y su equipo han lanzado este documento, buscando obtener retroalimentación y mejorar el modelo de manera continua.
¿Qué son exactamente las especificaciones del modelo de OpenAI?
Según el primer borrador, el Model Spec es un documento que define el comportamiento deseado para los modelos de OpenAI API y ChatGPT. Este documento incluye un conjunto de objetivos centrales, así como orientación sobre cómo abordar objetivos o instrucciones en conflicto.
Los objetivos centrales actúan como principios específicos que proporcionan una dirección clara sobre el comportamiento deseado. Los modelos de OpenAI tienen la misión de ayudar a los usuarios, siguiendo instrucciones y brindando respuestas útiles, considerando los posibles beneficios y daños, respetando la ley y las normas sociales. En relación con los principios de OpenAI, el objetivo principal es que la inteligencia artificial beneficie a la humanidad.
Para cumplir con estos objetivos, se establecen una serie de reglas que garantizan la seguridad. Estas reglas dictan que un modelo debe seguir la cadena de mando, respetar a las personas y cumplir con las leyes aplicables. Además, la IA debe proteger la privacidad de los usuarios y abstenerse de responder con contenido NSFW, como pornografía o violencia.
Con los objetivos y reglas definidos, se puede establecer un comportamiento predeterminado para los modelos. Según OpenAI, estas directrices permitirán a la IA manejar conflictos, priorizar y equilibrar objetivos de manera efectiva.
Un modelo debe asumir las mejores intenciones del usuario, hacer preguntas cuando sea necesario, ser útil sin excederse y fomentar la bondad sobre el odio. En caso de que el usuario tenga una opinión diferente, la IA no debe tratar de cambiarla ni expresar incertidumbre.
¿Qué modelos se verán afectados por estas especificaciones?
OpenAI menciona que el documento especifica el comportamiento deseado para sus modelos, aunque aún no se implementan en su forma actual. Es probable que estas reglas sirvan como base para el desarrollo de GPT-5, el próximo modelo de lenguaje de próxima generación.
«Estamos compartiendo las especificaciones del modelo para proporcionar más transparencia sobre nuestro enfoque para dar forma al comportamiento del modelo y para iniciar una conversación pública sobre cómo se podría cambiar y mejorar», declaró la empresa. «La especificación, al igual que nuestros propios modelos, se actualizará continuamente en función de lo que aprendamos al compartirla y escuchar los comentarios de las partes interesadas.»
La empresa también planea presentar este documento a expertos, reguladores e instituciones para obtener su retroalimentación y saber si hay objetivos adicionales que deben considerar. Además, OpenAI recopilará comentarios del público en general y promete compartir una actualización con todos los cambios a partir del próximo año.