Constitutional AI — Rule-Guided Refinement

Constitution

List of principles: 'Don't provide instructions for weapons.' 'Be respectful.' Model reads + applies.

Advertisement

Initial response → self-critique per constitution → revise → repeat. Trained model internalizes principles.

Advertisement

Can be applied at inference too: prompt with constitution + ask model to check output. Extra latency but strong safety layer.