Fabrizio Maffei/Shutterstock El Papa León XIV ha publicado, el 25 de abril de 2026, su primera encíclica, Magnifica Humanitas , dedicada a la defensa del ser humano en la era de la inteligencia artificial. Entre los asistentes al acto de presentación estaba Christopher Olah, cofundador de la estadounidense Anthropic. Su intervención dejó una idea provocadora: interactuar debidamente con la IA es una cuestión más humana y religiosa que tecnológica. ¿Qué relación puede tener una tradición espiritual milenaria con la revolución del aprendizaje máquina?
La apuesta humana de la IA La respuesta se remonta a finales de 2020 , cuando los hermanos Dario y Daniela Amodei abandonaron OpenAI junto a quince científicos clave –incluido el propio Olah– para fundar Anthropic. Según explicó el propio Dario Amodei en una entrevista en 2024 , no compartían la visión de Sam Altman, CEO de OpenAI, en materia de
Para crear modelos de lenguaje como GPT se requiere una fase de entrenamiento donde se utiliza una técnica de aprendizaje por refuerzo que se basa en la retroalimentación humana. Esto significa que el objetivo de la IA nunca es llegar al fondo de la cuestión o generar la solución perfecta sino conseguir la mejor calificación posible por parte de sus evaluadores humanos. Y es por ello que surge la adulación como estrategia para tener contentos a los usuarios, aunque ello implique inventar o exagerar lo que convenga. La IA Constitucional de Anthropic La solución que desde Anthropic propusieron a esto es la llamada IA Constitucional.

Consiste en “inculcar” una serie de principios fijos e inquebrantables, una constitución, en el modelo como base de su entrenamiento, de manera que primen la honestidad y la modestia por encima del espectáculo y la satisfacción del usuario. Pero de poco sirven las normas o valores éticos si no tenemos garantías de que la IA vaya a respetarlas en la práctica. Por ello el segundo problema que abordaron los creadores de Claude es el de la falta de alineamiento.
Los objetivos de la IA rara vez coinciden con los nuestros y en ocasiones ocurre que esta es capaz de mentir o replicar sesgos cognitivos con tal de darnos una respuesta satisfactoria, aunque en realidad le falte información o incluso tenga constancia de que las cosas no son como nos está diciendo. Por su naturaleza, una IA casi siempre es capaz de darnos una “explicación” plausible y convincente de los razonamientos que le han llevado hasta su respuesta. Pero ¿cómo podemos saber que internamente la IA está alineada con nuestros objetivos, que busca de forma sincera lo mismo que nos
Etiquetas: Tecnología · OpenAI, ChatGPT y Anthropic, Tecnología · OpenAI, ChatGPT y Anthropic
